在我的中央系统日志中,我可以看到LSI的Linux RDAC多path驱动程序出现以下错误。
[RAIDarray.mpp]MY_NICE_STORAGE_ARRAY:1:0:7 Cmnd-failed try alt ctrl 0. vcmnd SN 2436 pdev H1:C0:T0:L7 0x05/0x94/0x01 0x08000002 mpp_status:1
还有一些情况
[RAIDarray.mpp]MY_NICE_STORAGE_ARRAY:1:0:10 Illegal Request ASC/ASCQ 0x20/0x0, SKSBs 0x0/0x0/0x0
其次是
[RAIDarray.mpp]MY_NICE_STORAGE_ARRAY:1:0:10 IO FAILURE. vcmnd SN 887 pdev H2:C0:T0:L10 0x05/0x20/0x00 0x08000002 mpp_status:1
我在白天从几乎所有的SAN机器中得到它,但是并不是所有的机器都是这样 – 通常是在5个小时之内完成的。 所有FC交换机和所有FC HBA从今天开始都没有显示任何错误,当检查它们时,到任何LUN的所有path都已启动。 性能(IOPS和顺序访问)也非常好。 任何人看到这个?
那么ASC / ASCQ 0x20 / 0x0转换为无效的命令操作代码 ,这也可能是“无效的CDB字段”,例如此目标不支持此cmd。 我们不知道的是这个命令实际上是造成了这个后果。 打开详细的debugging此专有的MP驱动程序可能会有所帮助。
供应商特定的多path驱动程序消息没有多大帮助:
vmnd SN 2436 pdev H1:C0:T0:L7 0x05 / 0x94 / 0x01 0x08000002 mpp_status:1 [0x12000]
0x02是设置为CHECK CONDITION的状态字节,这意味着我们有一个问题,驱动程序字节是0x08 ,可以是任何厂商想要的iirc。 我不知道是什么0x05 / 0x94 / 0x01代表,请求支持。
看到这是SAN广泛的,假设你在所有这些工具上运行相同的LSI RDAC MP工具,我将集中精力处理LSI MP错误或SANconfiguration问题。 我也会研究任何集群configuration,并确保它们没有被意外打开。
由于您使用的是LSI mpath驱动程序,因此您应该从支持开始,并从此处开始。 在这里保持观点是很重要的,因为到目前为止,这个信息还没有导致任何致命的或有害的行为,到目前为止你已经测量了。 请记住,如果/当支持问你重新组装你的SAN;)。