DRBD手动故障转移

查看使用DRBD或集群文件系统来帮助在小型企业环境中发生停机时间的情况下正常运行。

我们目前使用Linux和samba为文件服务器使用服务器盒，然后在VM中运行Web服务器和数据库。正在考虑添加第二台服务器并将文件和虚拟机放到分布式文件系统上。基本操作系统更加静态，可以更容易地进行手动pipe理（在更改时复制configuration文件，如果需要从完整备份复制基本操作系统等）

问题是关于手动完成的故障转移场景。如果服务器1出现故障并手动进行故障切换，则只需将服务器2的静态IP设置为服务器1（服务器1再次closures并处于需要维修状态），启动Samba并启动这个虚拟机的静态IP与在服务器1上运行时具有相同的静态IP，并启动备份服务？

这听起来像一个简单而快速的过程。我错过了什么吗？这可以很容易地通过脚本自动化，也可以在故障情况下指导那些不熟练的人员运行。

如果我们有一个硬件故障，如果我们有一个硬件故障的时间可能很容易是没有呼叫IT支持和没有第二个服务器所需的部分的支持，但与第二个服务器，停机时间将是在几小时内（如果没有一个是办公室精通足够执行这样的操作，如果有人是分钟）

您所描述的故障转移过程非常简单。使用DRBD是创build冗余的关键步骤，因为您消除了像共享存储一样的单点故障。

您提到的当前故障切换可以通过Pacemaker / Corosync轻松实现自动化，因此无需人工干预。我更喜欢自写的脚本，因为它也关心如何屏蔽不起作用的节点，这样就不会遇到分裂的大脑情况（这可能会搞乱所有的数据）。

请记住，“真正的”HA需要完整（或至less最大可存档）的系统分离（单独的房间（或至less机架），不同的USV，冗余交换等）。单点故障通常会导致整体效率的提高。