存储raid5多块硬盘出现故障的数据恢复案例
存储数据恢复环境:
某单位一台存储,1个机头+4个扩展柜,有两组分别由27块和23块硬盘组建的RAID5阵列。其中由27块磁盘组建的那一组RAID5阵列崩溃,这组RAID5阵列存放是Oracle数据库文件。存储系统上层共划分了11个卷。
存储故障&检测:
存储内磁盘发生故障,存储设备上有两块盘的硬盘指示灯显示黄色,存储不可用,存储设备已经过保。
硬件工程师将故障存储中那组出现故障崩溃的阵列中所有磁盘编号后取出,对该RAID5阵列中的27块硬盘做了硬件故障检测,发现其中有2块硬盘出现坏道,SMART的错误冗余级别已经超过阈值。将25块正常的硬盘以只读方式进行全盘镜像,将2块发现有坏道的硬盘使用特殊手段进行处理后生成镜像文件。
收集&分析故障存储日志信息,分析判断两块硬盘的掉线时间,用数据较新的硬盘来恢复数据。
存储数据恢复方案:
方案a:把存储的所有硬盘都进行备份,然后通过原厂存储管理软件进行强制上线操作。
方案b:分析底层数据,利用分析获取到的RAID5结构相关信息重组RAID,然后从底层提取数据,重新加载oracle数据库,调试上层应用