MegaCLI导致驱动器“其他错误”

我有一个问题,运行“megalci -PDList -aAll”会导致我有一对服务器中的6个光盘中的2个logging“其他错误”。 这里再详细一点。

我有两台戴尔R610服务器。 每个有6个光盘组织如下:

RAID 1中的2个160GB SATA磁盘

RAID 10中的4个300GB SAS磁盘

当我运行检查光盘的megacli命令时,会导致错误logging到SATA驱动器。 两台服务器都是如此,这意味着4个驱动器都受到影响。

我需要两件事情,我需要帮助,找出为什么会发生这种情况,以及如何阻止它,而且我也需要帮助,让错误消失,让Nagios让我独处。 目前我接受任何方法来实现这些目标。

这两个服务器在CentOS 6.3 x64上。 无论使用MegaCLI版本1.01.39,版本8.02.21还是版本8.04.07,都会出现错误。 这是Megacli -PDList -aAll的前三个驱动器的输出。 这显示了两个坏的驱动器和一个好的驱动器。

 [root @ nfs1b〜]#/ opt / MegaRAID / MegaCli / MegaCli64 -PDList -aAll 

适配器#0

shell设备ID:32
插槽号码:0
驱动器的位置:DiskGroup:0,Span:0,Arm:0
shell位置:N / A
设备ID:0
WWN:
序号:2
媒体错误计数:0
其他错误计数:1001
预测性失败计数:0
最后预测失败事件序号:0
PDtypes:SATA

原始大小:149.049 GB [0x12a19eb0部分]
非强制大小:148.549 GB [0x12919eb0部分]
强制大小:148.5 GB [0x12900000部分]
固件状态:在线,启动
设备固件级别:8A22
盾计数器:0
成功的诊断完成:N / A
SAS地址(0):0x1221000000000000
连接端口号:0(path0)
查询数据:K85DTA926Y1YFUJITSU MHZ2160BK G2 8A22
FDE能力:不能
FDE启用:禁用
担保:不安全
locking:解锁
需要EKM注意:没有
外国:没有
设备速度:未知
链接速度:未知
介质types:硬盘设备
驱动器温度:N / A
PI资格:没有
驱动器格式化为PI信息:否
PI:没有PI
端口0:
端口状态:活动
端口的链接速度:未知
云端硬盘已标记SMART提醒:否

shell设备ID:32
插槽号码:1
驱动器的位置:DiskGroup:0,Span:0,Arm:1
shell位置:N / A
设备ID:1
WWN:
序号:2
媒体错误计数:0
其他错误计数:1001
预测性失败计数:0
最后预测失败事件序号:0
PDtypes:SATA

原始大小:149.049 GB [0x12a19eb0部分]
非强制大小:148.549 GB [0x12919eb0部分]
强制大小:148.5 GB [0x12900000部分]
固件状态:在线,启动
设备固件级别:8A22
盾计数器:0
成功的诊断完成:N / A
SAS地址(0):0x1221000001000000
连接端口号:1(path0)
查询数据:K85DTA926W8EFUJITSU MHZ2160BK G2 8A22
FDE能力:不能
FDE启用:禁用
担保:不安全
locking:解锁
需要EKM注意:没有
外国:没有
设备速度:未知
链接速度:未知
介质types:硬盘设备
驱动器温度:N / A
PI资格:没有
驱动器格式化为PI信息:否
PI:没有PI
端口0:
端口状态:活动
端口的链接速度:未知
云端硬盘已标记SMART提醒:否

shell设备ID:32
插槽号码:2
驱动器的位置:DiskGroup:1,Span:0,Arm:0
shell位置:N / A
设备ID:2
WWN:
序号:2
媒体错误计数:0
其他错误计数:0
预测性失败计数:0
最后预测失败事件序号:0
PDtypes:SAS

原始大小:558.911 GB [0x45dd2fb0部分]
非强制大小:558.411 GB [0x45cd2fb0部分]
强制大小:558.375 GB [0x45cc0000部分]
固件状态:在线,启动
设备固件级别:D1S4
盾计数器:0
成功的诊断完成:N / A
SAS地址(0):0x50014ee7aab51c32
SAS地址(1):0x0
连接端口号:2(path0)
查询数据:WD WD6001BKHG D1S4WXF1E62KUYR7
FDE能力:不能
FDE启用:禁用
担保:不安全
locking:解锁
需要EKM注意:没有
外国:没有
设备速度:未知
链接速度:未知
介质types:硬盘设备
驱动温度:26C(78.80 F)
PI资格:没有
驱动器格式化为PI信息:否
PI:没有PI
端口0:
端口状态:活动
端口的链接速度:未知
端口1:
端口状态:活动
端口的链接速度:未知
云端硬盘已标记SMART提醒:否

enter code here

由于这是由戴尔重新打造的LSI制造的卡,因为重新品牌化,我无法得到戴尔帮助使用MegaCLI或LSI的帮助。 我的谷歌search没有带来任何好处。

至于为什么发生这种情况,似乎该版本的MegaCli软件发出的命令不支持SATA驱动器。 您可以通过获取控制器事件日志来validation这一点:

 MegaCli64 -AdpEventLog -GetLatest 100 -f events.log -aALL 

执行后,一个events.log文件将包含控制器错误事件。 如果确实原因是驱动器发出不支持的命令,那么您的错误事件应该如下所示:

事件描述:意外感:PD 07(e0x20 / s7)path1221000007000000,CDB:4d 00 4d 00 00 00 00 00 20 00, 感官:5/24/00

根据这个通用码表 ,5/ 5/24/00的检测代码是“非法请求 – CDB(命令描述符块)中的无效字段”。

我find了这个问题的解决scheme。

我终于find了MegaCLI 4的一个版本 ,似乎喜欢我的老Fibutsu SATA驱动器。

如果这个链接将来会被淘汰的话,那么下载的内容应该在LSI网站上可以find,如果你有一点点挖掘的话 – 一个叫做“MegaRAID 820X MegaCLI-Linux,Version 3.00.03”的晦涩的理由,版本4.00.16作为下载。