所以有一个HP Integrity RX6600服务器,根本无法打开。 当用户打开机箱电源时,会在POST过程中挂起,无法进入EFI并启动操作系统。
在审查我将在这里分享的日志(MP日志)后,我们首先猜测是处理器载板或其CPU模块上的故障:
Log Entry 64: 09 Aug 2017 19:19:48 Alert Level 7: Fatal Keyword: BOOT_NOT_DETECTED No events were received from system firmware Logged by: Baseboard Management Controller; Sensor: Processor Data1: FRB2/Hang in POST failure 0x20598B6054020430 FFFF036F00070300 Log Entry 107: 09 Aug 2017 20:34:16 Alert Level 7: Fatal Keyword: MISSING_FRU_DEVICE Missing FRU device - Processor 0 Logged by: Baseboard Management Controller; Sensor: Entity Presence - Missing Device 0x20598B71C8020700 FF20807115250300
基本上CPU板上安装了2个CPU模块。 所以我们申请了CPU模块和CPU板的二手材料。 然而,在服务器上安装新的部件后,我们几乎面临同样的问题,这意味着服务器仍然无法检测到处理器0,因此POST过程无法完成。 我们用新安装的部件做了几个testing用例:
1-从Slot0移除CPU模块并开机:这将失败,我们收到相同的警报,加上当我们查询处理器状态:
Slot0: Installed and Not configured Slot1: Installed and configured
我发现这个不正常,因为Slot0没有CPU
我们将Slot1上工作的CPU换成了Slot0:它会失败,我们收到相同的警报,再加上当我们查询处理器状态时:
Slot0: Installed and Not configured Slot1: Not installed
有没有人遇到这样的问题? 还有什么我可以检查故障排除? 根据testing结果,我们可以得出结论:即使是新购买的CPU板有问题?
那么,显然CPU板有问题。 我们已经replace了另一个,现在一切都很好。 🙂