VMware自动重新启动所有主机

昨天我们的整个基础设施都崩溃了,因为我们所有的ESXi主机都认为同时运行更新是个不错的主意。 编辑:或者至less这是我们的想法发生,但没有人确定。

通常情况下,我们不会更新ESXi,除非我们遇到问题,或者通知某些必须修复的问题。

一些信息:

在HA主/从,ESXi版本5.5.0,IMM v.3.73,生成1331820configuration的3x IBM x3650 M4(7915D3G)

我们很困惑的情况。 我们的支持上面提供的错误原因和附加的日志文件打印行如(该文件是非常巨大的,所以我会坚持这个关键部分):

2014-11-04T10:58:48.364Z [488A1B70 verbose 'VpxaHalCnxHostagent' opID=WFU-e04c5e84] [WaitForUpdatesDone] Starting next WaitForUpdates() call to hostd 2014-11-04T10:58:48.364Z [488A1B70 verbose 'VpxaHalCnxHostagent' opID=WFU-e04c5e84] [WaitForUpdatesDone] Completed callback 2014-11-04T10:58:48.406Z [488A1B70 verbose 'VpxaHalCnxHostagent' opID=WFU-e4a7ca00] [WaitForUpdatesDone] Received callback 2014-11-04T10:58:48.406Z [488A1B70 verbose 'VpxaHalCnxHostagent' opID=WFU-e4a7ca00] [VpxaHalCnxHostagent::ProcessUpdate] Applying updates from 3526 to 3527 (at 3526) 2014-11-04T10:58:48.406Z [488A1B70 verbose 'hostdvm' opID=WFU-e4a7ca00] [VpxaHalVmHostagent] 26: Config changed 'config.extraConfig["vmware.tools.internalversion"].value' 2014-11-04T10:58:48.407Z [488A1B70 verbose 'hostdvm' opID=WFU-e4a7ca00] [VpxaHalVmHostagent] 26: Config changed 'config.tools.toolsVersion' 2014-11-04T10:58:48.407Z [488A1B70 verbose 'hostdvm' opID=WFU-e4a7ca00] [VpxaHalVmHostagent] 26: Runtime changed 'guest.toolsVersion' 

我们部门没有人触及这个级别的服务器 – 我们通常只pipe理虚拟机,而不是主机。 这怎么可能发生呢?

上午10点50分,服务器同时崩溃,三个人都没有做任何具体的事情。 我们的支持团队一直无法find任何types的问题的日志文件,这是非常奇怪的。

VMware主机服务器不会自动更新,而无需通过Update Manager从vCenter触发的故意操作。 请提供答案:

  • 你有什么具体的ESXi内部版本号?
  • 系统何时重新启动?
  • vCenter中的事件日志显示受影响的主机是什么? 应该很清楚发生了什么事。
  • IBM的带外pipe理工具/日志说了什么?

根据我在这里看到的信息,您的服务器可能会崩溃,IBMpipe理似乎已经自动重启系统。

你需要运行更新 。 您可能会触发Windows客人中的虚拟NIC适配器的错误。 它应该是vmxnet3而不是Intel e1000 / e1000e。 ESXi的构build1331820是古老而充满问题的。 在群集中运行vSphere时,保持更新非常重要。

看到:

为什么VMware ESXi 5.5崩溃?

VMwarelockingCPU峰值