几天前,我们的一台networking服务器在很短的时间内就closures了。 它不响应任何远程请求(说实话,我不知道如果USB键盘和显示器被插入,它是否会作出响应),数据中心的工程师重新启动服务器。
一切恢复正常,然后我检查了事件日志,看看是否有什么线索发生错误。 我真正能看到的事件是“先前的1AM关机意外”(这是服务器停机的时间,而不是工程师按下电源button的时间)。
该服务器有IIS – 但显然网站日志只显示导致崩溃(或冻结)的文件请求,崩溃前的stream量没有增加。 SQL Server也被安装,但是日志只是报告当服务器恢复时十几个事务被前滚。
还有什么我可以看看find一个可能的原因崩溃?
听起来像盒子挂了。 由于现场支持刚刚反弹的框是可能的,但不太可能会从日志中得到任何东西。
您需要启用CrashOnCtrlScroll支持( http://support.microsoft.com/kb/244139 ),重新启动该框,然后下一次挂起有人按住RIGHT Ctrl键并按Scroll Lock两次。 这将错误地检查(蓝屏)框,写出当前状态,然后重启。
您还需要确保将系统configuration为内核或完全内存转储。
谢谢,Brian Desmond Active Directory MVP
如果您已经启用了选项来创build崩溃转储文件,那么这是另一种可能性,尽pipeMicrosoft需要高级分析技能和/或支持案例才能从中获得有用的信息。 通常转储文件将被保存到%SystemRoot%\ MEMORY.DMP。
如果这是导致失败的“蓝屏死机”,并且服务器configuration为保存故障转储(这是默认设置),则可以debugging输出。 我发现的最好的方法是“如何在几分钟内解决Windows系统崩溃”问题 。
否则,如果有制造商提供的系统监视工具(如HP OpenView或Dell OpenManage),则应该查看硬件故障的证据。
最后,如果服务器位于UPS上,则需要查看与电源相关的故障。