Linux执行fsck后数据丢失的恢复
2020-10-13
客户名称:亦庄某云计算中心
 
介质信息:戴尔PowerVault MD3600F
 
客户描述:
 
        MD3600F有12个硬盘槽位,其中只使用了10块SAS 2TB硬盘创建的两组RAID,另外两个槽位闲置。一组是由4块

硬盘组成的RAID5做为web存储使用,另一组是由6块硬盘组成的RAID5作为文件存储使用,服务器使用red flag Linux

操作系统,做日常维护时发现用于web存储的LUN无法mount到服务器上,通过各类查询和及售后咨询,最终决定执行

fsck命令来修复这个卷,执行fsck命令后,进度一直停止在65%的状态不动,强制停止执行命令后,此卷还是原来的状

态,反复的执行几次fsck命令始终都无法完成。

 
恢复过程:
 
        1.处于安全考虑,客户要求需要将web存储使用的4块硬盘做磁盘镜像,对4块硬盘做磁盘镜像时没有发现硬盘故

障,从而可以判断web存储LUN不是硬盘故障导致的无法mount,应是此LUN的文件系统错误导致的;
 
        2.分别将4块磁盘镜像连接到数据恢复设备上,使用winhex分别查看每块硬盘的底层扇区,使用RAID虚拟功能将

4块硬盘虚拟重组,重组后得到一个名为web的LUN;
 
        3. LUN内没有任何数据(分区为Linux系统常用的EXT4),通过分析发现EXT4内部结构被破坏,是由于执行了

fsck命令导致的数据丢失,因为数据是大量的web应用文件,所以需要目录结构正常,应用才可被使用,经过几个小

时的修复和测试,数据被找回目录结构保持完整,只有一个应用层面的3级目录破坏的严重,但用户表示那个应用可以

重新安装;
 
用户验证:

        用户测试后确定web应用文件是完好的,平台可以正常使用,本次数据恢复成功。


电话咨询