无法在Hyper-V 2008R2群集上启动VM

我有一个2节点的Server 2008R2 Hyper-V群集。 他们在SAN上使用CSV。 我使用SCVMM来pipe理它们。 我们最近有几次崩溃导致了故障转移,导致虚拟机死亡,并在另一个节点上启动。 大多数情况下,这工作得很好。 在断电的一个时刻,两个节点都暂时无法访问SAN,CSV离线。 在故障转移群集pipe理器中将其联机工作,并且大多数虚拟机启动正常。

但是一台虚拟机将无法启动。

  • 在SCVMM中,它显示为丢失。
  • 在故障转移群集pipe理器中,它显示为脱机,“SCVMM主机名configuration”资源失败。
  • 尝试启动失败的configuration资源,或将虚拟机移动到其他节点会导致5分钟的等待,然后出现错误“错误代码:0x80071714该组无法接受请求,因为它正在移动到另一个节点”。

除了上面的错误之外,在任一节点上似乎没有任何最近的故障转移群集或Windows事件日志中的相关日志。 在上周发生故障时,我可以在故障转移群集pipe理器中看到一些关键事件:

  • 事件ID 21502:“SCVMM主机名configuration”无法向虚拟机pipe理服务注册虚拟机。
  • 25分钟后,事件ID 1230:群集资源“SCVMM主机名configuration”(资源types,DLL“vmclusres.dll”)崩溃或死锁。 资源寄存子系统(RHS)进程现在将尝试终止,资源将被标记为在单独的监视器中运行。
  • 那个重复了3次,相隔5分钟。
  • 从那以后没有日志。

我查看了SAN上的文件。 所有这些似乎都是完整的。 XMLconfiguration文件似乎是有效的(一些研究表明这可能发生,如果XML文件被损坏)。

编辑:我也运行了集群validation报告。 除了失败的资源和一些预期的错误,它们无法在线testing磁盘时,一切都看起来不错。

我怎样才能让这个虚拟机再次运行?

尽pipe不知道究竟是什么导致了这个问题,但再次让VM运行起来非常简单:

  • 找出哪个节点是VM所在的问题
  • 在VMM中将其置于维护模式(或者只是将所有内容都活动迁移到该节点上)。 问题虚拟机将仍然卡在该节点上。
  • 停止该节点上的群集服务,然后再次启动它。

当我停止集群服务时,VM立即被其余节点中的一个节点接pipe,并自动启动。