build立:
昨天我们停电了大约15分钟。
我们的刀片在UPS上,所以虚拟的主机(Windows Server 2008)从未停机。 我们的主开关不在UPS上,我们看到类似于以下的行为(从事件日志中提取)。
first )节点(启动故障转移?)。 这整个设置对我们来说是相当新的,所以我们仍然在学习这个。
问题是:
我们很快就把开关放在UPS上,但是想知道以上是预期的行为(看起来很脆弱),还是configuration明显改善来处理这种情况?
如果有evtx我可以上传一个关于究竟发生了什么的evtx文件。
该行为最可能的解释是与法定configuration有关。 看看http://technet.microsoft.com/en-us/library/cc731739.aspx 。
基本上,当你的networking交换机断开时,两个节点之间就失去了通信。 那时,节点都不知道对方在做什么。 如果一个节点决定要获得所有集群资源(即虚拟机)的所有权并引导它们,谁又会说另一个节点不会做同样的事情呢? 你最终会遇到这样一种情况:两个节点都试图获得所有虚拟机的全部所有权,并且你手上会有一些非常恶劣的硬盘损坏。
仲裁configuration解决了这个问题,指出为了使节点运行,它必须与大多数节点(以及可选的磁盘或文件共享)保持联系。 如果不能这样做,它将停止作为群集的成员运行。
要validation是否出现这种情况,请打开故障转移群集pipe理器,并在群集的摘要页面上检查“定额configuration”。 如果它是节点多数,并且你有一个偶数个节点,那么我所描述的几乎肯定是发生了什么事情。
解决办法是build立一个称为磁盘见证(Disk Witness)的小磁盘(50 MB绰绰有余),并将其添加到您的群集(但不是群集共享卷)的存储中。 然后,将“仲裁configuration”更改为“ 节点和磁盘多数” 。 使用此设置,如果您遇到与以前相同的故障,那么在发生故障时具有磁盘所有权的节点将继续运行(并且实际上将承担来自其他节点的所有资源的所有权),而另一个节点会停下来。 故障转移到function节点的虚拟机将经历一次残酷的重启,但至less他们会尽快上线。
正如你所说,理想的情况是在UPS上也有你的开关。 那样可以完全防止失败; 但是,您还应该确保对所拥有的节点数使用build议的法定configuration。