为冗长的问题提前道歉。
我们有一个Dell PowerEdge R720服务器:
Ubuntu Server 12.04 ) 3TB SATA drives in RAID 5 6个3TB SATA drives in RAID 5用于data 前几天我们试图访问大型RAID 5分区上的文件时出现错误。 我们重新启动了服务器,并得到了有关the raid controller has found a foriegn config 。 我们之前已经有了这个function,只需要使用戴尔的RAIDconfiguration工具来import foreign config到RAID中即可。 上次这个工作,但这一次,它开始做一个磁盘检查,然后我们得到这个:
FSCK has returned the following: "/dev/sdb1 inode 364738 has a bad extended attribute block 7 /dev/sdb1 unexpected inconsistency run fsck manually (ie without -a or -p options) MOUNTALL fsck /ourdatapartition [1019] terminated with status 4 MOUNTALL filesystem has errors /ourdatapartition errors where found while checking the disk drive for /ourdatapartition Press F to fix errors, I to Ignore or M for Manual Recovery"
我们按F去尝试修复这些错误,但最终却错误地发现:
Inode 275841084, i_blocks is 167080, should be 0. Fix? yes Inode 275841141 has an invalid extend node (blk 2206761006, lblk 0) Clear? yes Inode 275841141, i_blocks is 227872, should be 0. Fix? yes Inode 275842303 has an invalid extend node (blk 2206760975, lblk 0) Clear? yes .... Error storing directory block information (inode=275906766, block=0, num=2699516178): Memory allocation failed /dev/sdb1: ***** FILE SYSTEM WAS MODIFIED ***** e2fsck: aborted /dev/sdb1: ***** FILE SYSTEM WAS MODIFIED ***** mountall: fsck /ourdatapartition [1286] terminated with status 9 mountall: Unrecoverable fsck error: /ourdatapartition
我们注意到其中一个驱动灯根本没有点亮,认为这可能是失败的,并成为问题。 我们用备件replace了驱动器,并尝试“F”来修复它,但是我们一直得到与上述相同的错误。
在RAIDconfiguration实用程序中,所有驱动器显示为“在线”和“最佳”。
我们在另一个复制的服务器上有这个数据,所以我们不担心“恢复”任何东西,我们只是希望尽快恢复在线系统。
服务器有64或32GB的内存,不能记住我的头顶,但无论如何,用14TB的RAID,我认为可能还不够。
谢谢
编辑 – 我检查内存使用情况,而fsck运行的build议和2或3分钟后,它看起来像这样,使用了几乎所有的服务器内存:

5分钟左右后,当我的post出现错误时,内存立即释放:

编辑2 – 我做了badblocks sudo badblocks -nvs /dev/sdb1 ,但它回来了Pass completed, 0 bad blocks found. (0/0/0 errors) Pass completed, 0 bad blocks found. (0/0/0 errors)
它确实看起来像文件系统被洗脑。 由于您拥有另一台服务器上的数据,并且不需要从旧文件系统恢复数据,因此应该可以使用该分区来创build空白文件系统。
mkfs /dev/sdb1
并完成它。