RAID5重建全程必守注意事项(贴合你当前10盘mdadm软RAID场景)
# RAID5重建全程必守注意事项(贴合你当前10盘mdadm软RAID场景) ## 一、重建进行中(剩余同步阶段重中之重) ### 1. 严禁断电、关机、重启服务器【红线】 RAID5降级只剩单盘容错,断电重启有概率磁盘识别错乱、条带异常,第二块盘异常直接**整阵列数据清空报废**;机房确保UPS供电,杜绝拔电源线、强制关机。 ### 2. 禁止插拔任何硬盘 不要拔故障旧盘、新替换重构盘、闲置4T裸盘(槽4、槽11),插拔瞬间阵列直接离线。 ### 3. 严控磁盘IO,关停多余任务 1. **临时禁用FTP批量上传、大批量写入**,少量下载可读;大量写入持续抢占IO,拉高坏盘风险、拉长重建时间; 2. 终止备份、全盘扫描、杀毒、新建VG/pvcreate等磁盘初始化任务(你当前CreatVG就是IO堵死FTP的元凶,可安全终止新建VG进程,不损坏原有数据); 3. 不做磁盘整理、fsck磁盘检查、分区调整。 ### 4. 不改动RAID配置 禁止执行`mdadm --create`重建阵列、删除md配置、修改分区,该操作会覆盖超级块,原始数据永久性损坏。 ### 5. 监控磁盘健康 定时用`smartctl -a /dev/xxx`查看所有阵列盘,重点看新盘与老盘坏道、重试计数,**重建途中任意一块盘SMART报错飙升,立刻停止写入业务**。 ## 二、重建速度调节要点 1. 不要无限拉满重建速度,速度过高磁盘满载升温易坏盘; ```bash #稳妥参数 echo 120000 > /proc/sys/dev/raid/speed_limit_max echo 25000 > /proc/sys/dev/raid/speed_limit_min ``` 2. 业务繁忙时段重建会自动降速属于正常机制。 ## 三、100%重建完成后的操作顺序 1. 先查看`/proc/mdstat`状态变为`clean`,无Degraded、Recovering标记,阵列冗余恢复; 2. 检查所有硬盘SMART状态,定位之前掉线故障盘,标记报废/返修; 3. 挂载分区,测试FTP目录浏览、文件下载,核对数据完整性; 4. 确认数据无误后,再去做LVM新建VG、磁盘扩容、闲置硬盘规划; 5. 逐步放开FTP上传权限。 ## 四、你这套阵列专属额外提醒 1. **混盘隐患(企业盘+监控盘混用)**:重建完成后留意日常磁盘温度、负载,两种盘耐久不同,后期优先逐步替换统一型号硬盘; 2. 槽位4、11两块闲置休眠硬盘:**不要随意加入现有md0阵列**,加入会触发阵列全盘重构,再次陷入高危降级;如需扩容单独新建RAID。 ## 五、突发应急 若重建中途又一块硬盘掉线:**立刻停机断电,不要再开机**,禁止继续重建,直接走数据恢复方案。 需要我给你一份重建完工后的逐项检查命令清单?