远程数据中心之间HA的最佳select?

我们正在审查新客户带给我们的系统要求。 他们在医疗领域工作,他们希望我们托pipe的系统必须至less具有高可用性,并且最好具有容错能力。

我们正在考虑授权VMWare Enterprise来获得他们的FT和兼容硬件的HA和FTfunction。 没有biggie – 10Gbs以太网价格下降,而1Gb以太网则不成问题。

但客户的要求之一是我们有一个房地产(不是金融时报,但金融时报将是很好的)网站是在一个完全不同的城市。

澳大利亚的带宽是非常昂贵的,我甚至不知道是否有可能在悉尼和墨尔本之间获得1Gbps的连接(相距约1000公里/ 600英里)。 我可能很难在两个城市之间获得100Mbps的连接。

我有什么select提供高可用性系统? 不必与VMWare,但如果一个网站宕机,我需要能够login到第二个网站,点击开始button,并开始运行。

我目前正处于获取为$ WORK设置的DR / HA远程数据中心的初始规划/实施阶段。 在服务器虚拟化(VMware)和存储虚拟化(Compellent SAN)方面,我们当前的环境已经高度虚拟化。 因此,我们认为利用这些技术和他们可用的HA解决scheme是最有意义的。

我们所有的VMFS卷目前都驻留在Compellent SAN上,我们将使用卷的asynchronous卷复制来保持远程站点上另一个SAN的相对同步(可能每隔15分钟)。 那么,对于VM本身,我们正在使用VMware的SRM。 很酷的产品,我猜你听说过。 如果你愿意,它可以非常抽象/自动化故障转移到你的辅助数据中心点击一个button。 很漂亮。

对我们来说幸运的是,我们在用于SAN复制的站点之间有一个GigE链接(等等)。 当每15分钟同步一次时,我们的情况下的音量增量就不会那么大。 根据客户系统的stream失程度,通过100Mbps链路(甚至更小)保持同步可能并不是那么困难。 我知道其他正在通过单一T1进行同步的Compellent客户。 显然,这里并没有发生太多的数据变化。

无论如何,这里有几件事情要考虑:

  • 小心你的掉线。 他们很可能不需要被复制。 当然,远端的系统需要swap luns,但是你可能会把这些虚拟机重新映射到local-only lun。 这样,您就不必担心复制无用数据的开销。
  • 确保您的SAN供应商有一些故障恢复计划。 您不希望在生产环境在故障转移站点运行几个月,因为您无法弄清楚如何在主站点恢复同步。
  • 这不用说,但testing,testing,testing。 VMware SRM使此操作变得非常简单,并且可以为您提供很好的故障转移testing报告,以交给PHB。
  • IP寻址。 在我们的例子中,我们在两个站点之间运行802.1QinQ,所以在故障转移站点运行时重新寻址服务器(幸运的是)不是必须的。 但是,这确实需要每个站点的BGP通告(具有适当的权重)以及每个站点的防火墙规则,以便当stream量切换到故障转移站点时,事情将按预期工作。

这就是我现在所有的build议。 在六个月的时间里,当我(希望)接近完成DR系统的时候,我相信我会学到更多的东西。 :) 祝好运并玩得开心点!

在$ WORK中,我们正在评估HP P4000 SAN(AKH LeftHand)上的VMWare SRM。