识别RAID中发生故障的硬盘

我有一台运行Debian定制版本的服务器。 它附有一个太阳存储突袭。 它具有非常有限的工具,不允许安装新工具。 🙁

这个消息我在dmesg看到:

 end_request: critical target error, dev sda, sector 556782970 sd 0:0:0:0: [sda] Unhandled sense code sd 0:0:0:0: [sda] Result: hostbyte=0x10 driverbyte=0x08 sd 0:0:0:0: [sda] Sense Key : 0x4 [current] sd 0:0:0:0: [sda] ASC=0x44 ASCQ=0x0 sd 0:0:0:0: [sda] CDB: cdb[0]=0x28: 28 00 21 2f d5 7a 00 00 08 00 end_request: critical target error, dev sda, sector 556782970 

所以看起来在556782970有一个坏块,但是我不知道它属于哪个硬盘,所以我可以把它replace掉。

更多信息: http : //pastebin.com/cJ2bUywj

工具不可用:( smartctl badblocks

如果你真的使用arcconf,你可以看到这样的物理驱动器状态:

 arcconf getconfig 1 PD 

查找具有失败状态的驱动器以标识已标记为失败的驱动器。 为了您的参考,输出将看起来像这样:

  Device #6 Device is a Hard drive State : Failed Block Size : Unknown Supported : Yes Reported Channel,Device(T:L) : 0,15(15:0) Vendor : *MISSING* Model : Firmware : Total Size : 0 MB Write Cache : Unknown FRU : None SMART : No SMART warnings : 0 SSD : No MaxCache Capable : No MaxCache Assigned : No 

根据end_request: critical target error, dev sda, sector 556782970 line,我认为/ dev / sda是​​麻烦的孩子。 您可以使用以下方式find该设备的序列号:

 ls -l /dev/disk/by-id | grep "sda$" 

虽然可能有一个答案可以让你获得操作系统中的信息,但控制器固件可以告诉你是否在启动时访问它。

我在剪切和粘贴中注意到的另一件事是你的电池说“失败”。 我想知道条纹是否因为写入caching电池烤面包而报告失败? 虽然它报告和实际不良的inode可能意味着你有两个问题。

尽pipe我在使用Adaptec控制器方面的经验(通常是在电池耗尽时),但它将禁用写入caching作为先发制人的措施。