是否正常的SAS驱动器有几个坏块,或者我应该尽快更换我的驱动器?

我有一个RAID 1镜像的驱动器部分 – 有两个坏块。 Adaptec存储pipe理器在检测到数据块时通过电子邮件发送给我。 它显示了该驱动器的4个中等错误,但状态仍然是“最佳”。

这是我第一次使用Adaptec RAID控制器。 我不知道偶尔坏块是否正常,或者我应该立即更换那个硬盘。


更新:驱动器在当天晚些时候失败!


磁盘子系统是:

  • 带ZMM的Adaptec 6405
  • (2)希捷近线SAS硬盘(ST31000424SS)

另一个驱动器还没有报告任何坏块。 我正在进行一致性检查。

Adaptec Storage Manager截图

当在arrays中使用驱动器时,控制器将设置时间限制错误恢复。 这将导致磁盘报告中等错误,如果他们不能立即读取数据。 这并不意味着他们不会从读取错误中恢复过来,或者这个部分是完全不可读的。
(便宜的SATA驱动器不支持TLER,并且会导致读取操作在驱动器尝试恢复数据时挂起;这只是便宜的SATA驱动器不应该安装在arrays中的许多原因之一;这当然不适用对这个特定的问题)

如果磁盘确定扇区不可读,则会重新映射该扇区。 最初的坏扇区不会被上报链,所以运行在OS上的软件无法知道。 您唯一能做的就是查看SMART报告,看看有多less扇区被重新映射。 许多部门被重新映射,是坏事情的一个很好的标志。 SMART还可能会报告该磁盘遇到软错误与硬错误的次数。

无论如何,SMART失败前的预测一直没有什么帮助, Google SMART研究支持这一点。

大型驱动器有很多额外的空间用于移动坏道,我已经看到在两个星期的过程中有数百个扇区被replace,然后驱动器继续运行了一个月(RAID6,所以我们并不急于)。

如果每天都有更多的replace部门提醒您,那么我会在失败之前将其replace。 第一次使用驱动器时出现的一个坏扇区爆发根本不可怕,但持续状态通常意味着机箱内的微粒或读/写头受损。

我没有使用SAS驱动器,但是我有定期的SCSI驱动器和IDE驱动器,几个坏块,然后工作多年,没有任何其他问题。 SMART状态应告诉您驱动器何时下降并冒失败风险。

另外,只要您使用的是RAID 0以外的RAID,那么在出现故障时您将受到保护。

我通常不回答我自己的问题,但在这种情况下,我有一个明确的答案: 尽快更换驱动器。 有关的驱动器当天晚些时候失败了。

上午早些时候,我收到了三封如下所示的电子邮件。 这就是我所知道的驱动器坏块,是唯一的警告:

====================================================================================== ADAPTEC's EMAIL NOTIFICATION MANAGER (Instant) ====================================================================================== Event Type : Warning Event Source : [email protected] Date : 06/29/2011 Time : 05:29:03 AM PDT -------------------------------------------------------------------------------------- Event(s) List With Description -------------------------------------------------------------------------------------- Bad Block discovered: controller 1 (21a6e00). -------------------------------------------------------------------------------------- **[Note]: This message was generated by the Adaptec Storage Manager Agent. Please do not reply to this message. 

到最后,它已经失败了。