IBM P720小型机+爱数存储
2020-10-13
客户名称:甘肃天水市某机关单位
介质信息: IBM Power 720与爱数存储服务器
客户描述:
IBM P720小型机与爱数存储服务器搭建了一个应用存储服务平台用于存储Oracle数据库。在正常巡检和维护过程中发现爱数存储有硬盘报警,登入爱数存储管理平台后,发现其中一块硬盘处于离线状态,因爱数存储创建的是RAID5阵列,所以果断替换了故障硬盘,硬盘替换后服务平台和数据一切正常。平台运行几天后突然无法访问数据,通过IBM P720终端发现找不到存储设备,登入爱数存储管理平台后提示找不到RAID信息,并且有2块硬盘处于离线状态。
恢复过程:
1.通过查看日志分析得出RAID信息找不到是因为有两块硬盘离线导致的,另外一块硬盘离线后又自动上线,合计有三块硬盘出过故障,因为故障是发生在夜间所以无法及时发现。
2.分别检测3块故障硬盘,发现3块硬盘上均有数量不一的坏道(坏扇区)。
3.考虑到硬盘损坏情况和数据安全,分别对爱数存储服务器的12块硬盘做镜像(克隆),然后使用镜像做数据恢复。
4.分析镜像得出准确的RAID参数,使用winhex工具将12块硬盘进行重组,通过我们对AIX文件系统的了解和掌握,我们发现存储上有一个LVM分区,6个500GB的PV与一个VG、一个名为ordata的LV。分别提取6个500GB的PV,然后利用本公司自主开发的AIX小型机恢复软件进行解析,解析后得出ordatalv大小为2.92TB,使用jfs2文件系统,挂载名为/ordata。
5.通过上面的操作后可以直观的看到文件目录树和文件以及文件大小,计算ordata使用空间为1.77TB,通过与客户沟通确认数据空间大小相符。
6.随机读取几个文件进行测试,确认数据正常无误,然后将数据备份至新搭建的存储服务器上,再通过IBM P720终端进行微调,将Oracle数据库正常启动。
用户确认:
客户将其它服务重启后,在本地PC打开应用访问和查看数据,所有数据全部正常的,到此数据完整恢复。