修复HA群集的正确方法是什么?

背景/目标

  • 我有一台VMWare HA集群,用于生产两台主机的机器。
  • 目前它的设置可以解释多达一台主机的故障。 它不使用DRS。
  • 我需要修复这两个服务器来应用修补程序。 我想这样做零宕机。

问题

  • 我可以将集群中的虚拟机专门移动到集群中的其他主机,然后取下服务器?
  • 在HAconfiguration中修复服务器以避免停机的最佳/推荐的方式是什么?

如果您没有使用DRS,则在VUM修复主机之前,您必须手动将已启动的VM撤出到群集中的其他主机。 还build议,如果您正在使用HA许可控制,分布式电源pipe理或容错,则在修复主机之前禁用这些function。

简而言之,将已启动的VM迁移(vMotion)到群集中的其他主机,修复主机,然后将VM迁移回来。

在主机/群集修复选项屏幕中禁用正确的选项:

我通常禁用准入控制,容错和DPM(但谁使用 ?)

如果进程似乎没有启动,我可能会手动vMotion几个虚拟机。

耐心一点。 每台主机最多需要10-15分钟,具体取决于您的连接。

在这里输入图像说明

修复集群中的主机时,主机进入维护模式,然后将VM切换到另一主机并启动更新过程。 一旦更新过程完成,主机将退出维护模式。 然后你可以做滚动主机升级说话。 尽pipe你可以做到这一点,但是我不相信这个步骤是必须的。 所以就你而言,只要你在另一台主机上有容量,你可以修复第一台主机,等待updfate进程完成(查看任务和事件以获得详细信息),然后执行另一台主机