我的一台服务器DELL PowerEdge 2850遇到了问题。它意外重启,将事件ID 6008引发到事件日志(“意外关机”)。 这个问题昨天就开始了,昨天已经重启了10次左右,并且一直持续到今天。
事件日志中没有其他事件或错误logging在6008事件之前。 我们没有改变任何硬件。 我们唯一改变“软件”的方式是,我们打开了一个我们开发的.NET服务,它运行在一个运行了两年的同一台服务器上。 除此之外,软件保持不变。 我有它设置做一个内核内存转储,每当有一个服务器故障,但它甚至没有这样做。 我称之为技术支持,但我们仍然没有解决scheme。 我已经重新安装了电源,切换了服务器电源所在的PDU,然后运行了完整的DELL Diagnosticstesting(不是快速testing),所有事情都通过了。 我build议技术支持可能是电源供应,但说不,因为它有两个电源,一个作为备份,所以不能这样。
其他说明,这些服务器不在USP上 – 这不是理想的,但是这是设置。 我在房间里有两台服务器,没有一台服务器遇到同样的问题。
有没有人遇到类似的问题? 任何见解或build议将不胜感激!
谢谢!
反过来,你做了最后一件事(打开你的.NET服务),不pipe它在过去如何运行,或者如何运行在另一台服务器上。
这可能是导致重新启动的一大堆事情。 既然你说你启用了内核转储,而你没有得到一个,那么就说明要么立即从系统中删除掉电源,要么给它一个机会,否则内核认为将转储写入磁盘是不安全的。 无论哪种方式,这听起来与我有关的硬件。
您可能需要将其closures并重新安装内存,并且如果硬盘是热插拔的,只需要给他们一点点的帮助。 抓着吸pipe,但你永远不知道。
通过事件日志,在关机之前发生了什么事情 – 什么是不寻常的,或者在它自行closures之前奇怪的一致? 系统日志可能是最有帮助的,但应用程序日志有时可能会显示一些有趣的事情。
我对戴尔服务器并不熟悉,但是如果它们与惠普的服务器类似,那么他们会有某种iLO,这可能会给您一些硬件故障的指示。 我有类似的东西–Windows报告意外关机,但惠普集成日志报告硬盘在重启前立即死亡,我只能假设RAID控制器扔了一个Windows不乐意与摇晃的摇摆。