使用RAID 1和NBD创build磁盘镜像以进行故障转移是不是一个好主意?

我想要做的是在故障转移机器上创build一台机器磁盘的镜像,这样,如果主机发生故障,我只需重新启动故障转移,select一个不同的根分区,然后准备就绪。

我这样设置:

  1. 主要机器和故障转移机器。
  2. 两台机器都有一个定义的RAID分区。
  3. 故障转移机器通过nbd-server为其RAID部分提供服务。
  4. 主机通过nbd-client安装故障转移的RAID分区。
  5. 在主机上,两个RAID分区通过mdadm合并到一个RAID设备中,远程分区的--write-mostly标志被设置。

我写了一些脚本来自动启动所有的东西,在故障转移中configurationgrub,以便它有正确的选项,允许你从小的镜像分区或故障转移分区启动。 我testing了它,它工作。

我遇到的问题是,大约每周一次,主机似乎完全冻结。 您不能ssh进入它,控制台将不会响应,并在重新启动机器后,日志条目只是在某个时间停止,没有在日志中指示错误。

我断开了NBD分区,只用RAIDarrays中的本地磁盘运行了所有内容,运行了一个月,没有任何问题。

NBD不稳定? 可能RAID决定断开本地分区并在networking出现故障的同时运行nbd分区? 这只是错误的方式去呢?

谢谢。

你想要捕捉的问题是一个复杂的问题。

对于通过networking镜像磁盘分区似乎drbd是正确的select。 drbd不是微不足道的,但很容易,在几个小时内正确设置它。

如果您计划在这台机器上进行自动故障切换,您可以看看Linux-HA 。

但是,你必须知道,医pipe局是一个非常复杂的机构,其学习曲线陡峭。 所有这些东西都将在投入生产之前进行仔细的testing。 你被警告了!