我正在使用MegaCLI来监视IBM ServeRAID M5015控制器的RAID状态,我在磁盘上有一个这样的:
Enclosure Device ID: 252 Slot Number: 6 Enclosure position: 0 Device Id: 14 Sequence Number: 2 Media Error Count: 32 Other Error Count: 0 Predictive Failure Count: 18 Last Predictive Failure Event Seq Number: 8119 PD Type: SAS Raw Size: 279.396 GB [0x22ecb25c Sectors] Non Coerced Size: 278.896 GB [0x22dcb25c Sectors] Coerced Size: 278.464 GB [0x22cee000 Sectors] Firmware state: Online, Spun Up SAS Address(0): 0x5000c50042c319c9 SAS Address(1): 0x0 Connected Port Number: 5(path0) Inquiry Data: IBM-ESXSST9300653SS B6336XN04HC10525B633 IBM FRU/CRU: 81Y9671 FDE Capable: Not Capable FDE Enable: Disable Secured: Unsecured Locked: Unlocked Needs EKM Attention: No Foreign State: None Device Speed: 6.0Gb/s Link Speed: 6.0Gb/s Media Type: Hard Disk Device Drive: Not Certified Drive Temperature :33 Celsius
这是什么意思? 我找不到确切的描述,有没有办法获得更多的细节? RAIDarrays具有最佳状态。
媒体错误计数: 32
预测失败计数: 18
有没有办法通过CLI来打开前面的LED灯,以便我知道我需要更换哪个磁盘?
您的磁盘上有错误。 SMART代表自我监测,分析和报告技术
您提到的具体错误与驱动器的机械降级有关。 您可以使用此报告来获取IBM的保修更换。 驱动器将最终失败。
在这一点上,驱动器在物理上是失败的。 现在要担心的最重要的事情就是对数据进行良好的备份,并尽快将驱动器replace为一个计划。
从希捷文档:
预测性失败
当驱动器在一段时间内运行不可接受时,SMART发出预测性故障信号。 固件保持每个属性的错误率不可接受的次数的运行次数。 为了达到这个目的,每当错误率是不可接受的,计数器就会增加,并且每当错误率可以接受时,计数器就会减less(不超过零)。 如果计数器不断递增以达到预测阈值,则发出预测失败信号。 这个计数器被称为失败
历史logging。 每个属性都有一个单独的失败历史logging计数器。
这里找出有问题的磁盘:
MegaCli -PdLocate -start -physdrv\[E:S] -aA