SMART – 预测故障计数

我正在使用MegaCLI来监视IBM ServeRAID M5015控制器的RAID状态，我在磁盘上有一个这样的：

Enclosure Device ID: 252 Slot Number: 6 Enclosure position: 0 Device Id: 14 Sequence Number: 2 Media Error Count: 32 Other Error Count: 0 Predictive Failure Count: 18 Last Predictive Failure Event Seq Number: 8119 PD Type: SAS Raw Size: 279.396 GB [0x22ecb25c Sectors] Non Coerced Size: 278.896 GB [0x22dcb25c Sectors] Coerced Size: 278.464 GB [0x22cee000 Sectors] Firmware state: Online, Spun Up SAS Address(0): 0x5000c50042c319c9 SAS Address(1): 0x0 Connected Port Number: 5(path0) Inquiry Data: IBM-ESXSST9300653SS B6336XN04HC10525B633 IBM FRU/CRU: 81Y9671 FDE Capable: Not Capable FDE Enable: Disable Secured: Unsecured Locked: Unlocked Needs EKM Attention: No Foreign State: None Device Speed: 6.0Gb/s Link Speed: 6.0Gb/s Media Type: Hard Disk Device Drive: Not Certified Drive Temperature :33 Celsius

这是什么意思？我找不到确切的描述，有没有办法获得更多的细节？ RAIDarrays具有最佳状态。

媒体错误计数： 32

预测失败计数： 18

有没有办法通过CLI来打开前面的LED灯，以便我知道我需要更换哪个磁盘？

您的磁盘上有错误。 SMART代表自我监测，分析和报告技术

您提到的具体错误与驱动器的机械降级有关。您可以使用此报告来获取IBM的保修更换。驱动器将最终失败。

在这一点上，驱动器在物理上是失败的。现在要担心的最重要的事情就是对数据进行良好的备份，并尽快将驱动器replace为一个计划。

从希捷文档：

预测性失败

当驱动器在一段时间内运行不可接受时，SMART发出预测性故障信号。固件保持每个属性的错误率不可接受的次数的运行次数。为了达到这个目的，每当错误率是不可接受的，计数器就会增加，并且每当错误率可以接受时，计数器就会减less（不超过零）。如果计数器不断递增以达到预测阈值，则发出预测失败信号。这个计数器被称为失败

历史logging。每个属性都有一个单独的失败历史logging计数器。

这里找出有问题的磁盘：

 MegaCli -PdLocate -start -physdrv\[E:S] -aA

E：shell
S：插槽
答：适配器