间歇性Windows Server 2008 BSOD并重新启动

我们的EC2实例(Windows Server 2008)在过去的3个月内(上次是今天1:05 EST)多次崩溃。 在审查MEMORY.DMP文件后,我们注意到可能的崩溃原因是rhelnet.sys(RedHat PV NIC Driver)。

服务器的事件查看器崩溃后立即有以下logging:

Critical - Kernel Power: The system has rebooted without cleanly shutting down first. This error could be caused if the system stopped responding, crashed, or lost power unexpectedly. BugCheck: The computer has rebooted from a bugcheck. The bugcheck was: 0x000000d1 (0x000000000000002d, 0x0000000000000002, 0x0000000000000000, 0xfffff88001402d14). A dump was saved in: C:\Windows\MEMORY.DMP. Report Id: 100113-35849-01. 

这可能是一个硬件问题? 如果我们停止并启动实例,会有帮助吗? 或者,这更可能是由系统上运行的软件引起的?

[更新10.01.2013]

Amazon Repbuild议在我们的实例上将RH驱动程序更新为Citrix PV驱动程序:

升级PV驱动程序

[更新10.08.2013]

我们对克隆的实例执行了驱动程序升级。 在升级之后,我们注意到我们的事件查看器中有下列错误:

 Xennet6 errors in Event Viewer (Event ID# 5001) 

挖了多一点后,我发现这篇文章build议安装最新的Citrix驱动程序。 不幸的是,这并没有帮助我们,我们的克隆实例变得没有反应。

[更新10.08.2013 2]

我重新创build了一个实例并更新了PV驱动程序。 在互联网上search后,我发现这篇文章在Amazon Rep解释说:

 "Event ID 5001 from source Xennet6 cannot be found" message does not indicate anything wrong, just that the PV driver is looking for a feature that we have not implemented in our version of Xen. 

我会保持我的testing系统运行一段时间,看看是否有任何问题。

根据Amazon Repbuild议升级驱动程序修复了isuse。

关于Event ID 5001...下面的问题是我从亚马逊得到的答复:

 Please ignore the Xennet 5001 error. This error occurs on every instance that is launched with Citrix PV drivers and is due to the driver looking for a feature that is not supported on EC2. It will have no other effect on the instance.