我最近承受了这台服务器的突然重启。 我想知道为什么发生。 我只看到在system.log重启之前发生的事情是关于iLO的。 iLO未连接,也未使用。 日志中没有关于iLO的其他消息。
任何想法 ?
操作系统:Debian Etch
Dec 15 10:55:13 s01 snmpd[2717]: Connection from UDP: [127.0.0.1]:59243 Dec 15 10:55:16 s01 hpasmxld[4745]: OsKcsExecCmd: IPMI NetFN 0x36 CMD: 0x2 has timed out! Dec 15 10:55:26 s01 hpasmxld[4745]: OsKcsExecCmd: IPMI NetFN 0x36 CMD: 0x2 has timed out! Dec 15 10:55:29 s01 snmpd[2717]: Connection from UDP: [127.0.0.1]:59243 Dec 15 10:55:36 s01 hpasmxld[4745]: OsKcsExecCmd: IPMI NetFN 0x36 CMD: 0x2 has timed out! Dec 15 10:55:44 s01 snmpd[2717]: Connection from UDP: [127.0.0.1]:59243 Dec 15 10:55:46 s01 hpasmxld[4745]: OsKcsExecCmd: IPMI NetFN 0x36 CMD: 0x2 has timed out! Dec 15 10:55:46 s01 hpasmxld[4745]: iLO 2 Communications Error - Attempting synchronization! Dec 15 10:55:59 s01 snmpd[2717]: Connection from UDP: [127.0.0.1]:59243 Dec 15 10:56:29 s01 last message repeated 2 times Dec 15 10:56:31 s01 hpasmxld[4745]: iLO 2 has responded to reset request . . . Dec 15 10:56:31 s01 hpasmxld[4745]: Stopping the Watchdog Timer . . . Dec 15 10:56:31 s01 hpasmxld[4745]: Resetting Internal Data structures . . . Dec 15 10:56:31 s01 hpasmxld[4745]: Initializing Internal Data structures from iLO 2. . . Dec 15 10:56:31 s01 hpasmxld[4745]: The iLO 2 reset / synchronization has completed successfully
查看这里的信息:
这似乎表明,经过长时间的低服务器利用率,自动服务器恢复发生。
由于您的计算机安装了HPpipe理代理程序(基于日志条目),因此可以快速查看HP Integrated Management日志以查看是否实际logging了ASR。 运行hplog -v显示日志。 指示ASR关机的典型消息如下所示:
0003 Critical 13:49 02/23/2010 13:49 02/23/2010 0001 LOG: ASR Detected by System ROM
你也可能想检查你的消息日志。 HPpipe理代理可以在ASR之后输出如下所示的内容:
Trap-ID=6025 An 'ASR Recover Complete' trap signifies that the system has been shutdown by the ASR feature and has just become operational again.
我有一个类似的故障与惠普服务器,由于工厂CPU散热器安装不当,导致过热。
服务器本身没有显示出现问题的迹象,但在您的情况下,检查CPU温度和(在有计划的维护期间)运行内存检查可能是值得的。