我在节点上有一个带有IPMI接口的Intel Linux集群。 最近,IPMI接口一直performance不佳。 例如,我不能再使用IPMI命令来获取节点进行PXE启动,并通过IPMI重新启动它们,但有时并非总是如此。
我最近发现,你可以用ipmitooltesting机箱和BMC,这是输出:
# ipmitool chassis selftest Self Test Results : device error [FRU Internal Use Area corrupted] # ipmitool bmc selftest Selftest: device corrupted Internal Use Area corrupted
看起来有什么问题。 有没有办法将IPMI接口恢复到原始状态? (请注意,我不知道具体的IPMI硬件在这里,或者如何查询它们以找出)。
重新刷新固件/ BIOS可能会帮助…或硬盘电源循环 – 完全拔出它。
他们是什么types的机器?
我会首先尝试在同一types的其他机器上validation这一点 – 很可能所有相同types的系统都具有某种ipmi怪异性,使得ipmitool无法正确处理。
运行ipmitool reset warm或ipmitool reset cold有时可以帮助。