结合故障转移群集和数据库镜像

在SQL Server中组合故障转移群集和数据库镜像时,需要更改镜像伙伴超时值,以便本地群集有机会在数据库镜像失败之前进行故障转移。 我很好奇在把这些技术结合起来的时候人们在做什么 – 我教各种HA类,这不是很常见的组合。

这是我的问题,如果你正在使用故障转移群集和数据库镜像相结合。 如果你能在每个回答中回答他们,那对我来说是非常有用的。 我不需要解释为什么需要改变什么东西或者技术是如何工作的 – 我曾经在微软拥有它们 – 我对工业界的做法感兴趣,现在可以和他们结婚了4年。

1)平均需要多长时间才能为群集SQL Server实例进行故障转移? (我知道这取决于需要多less崩溃恢复,但什么是平均水平?)

2)对于这些相同的实例,您将镜像伙伴超时设置为什么?

3)对于真正的集群中断可能发生的事实,您感到满意吗?可能需要一段时间,直到镜像发现由于您已经使镜像伙伴超时而失败。

感谢所有的回应!

保罗,1.通常几秒钟,长达几分钟取决于…(你知道其余的)。

  1. 如果我设置自动故障转移,我会去几分钟。 这种方式站点到站点的VPN连接将有时间来恢复,群集可以重新启动等等。至less我可能会用4分钟的时间比在集群节点重新启动时停电。

  2. 是的。 DR问题通常被定义为一个小时以上的失败。 此外,可能需要比全球负载平衡器更长的时间才能注意到其他站点已closures,并且上传所有的DNS以及DNS上的TTL时间。 这个总时间应该是自动故障转移时间的上限。

我没有参与原始devise,但这是如何设置的:

  • 每个站点上有2个节点集群,运行主动/主动
  • 该应用程序总共使用5个数据库,在一个实例上运行4个。 另一个数据库1运行它自己(更高的负载)
  • 这些网站通过深色纤维连接
  • 每个站点具有相同数量的使用镜像感知客户端的Web服务器
  • 数据库镜像是为所有5个数据库设置的
  • 每个站点还有一个独立的服务器,可以作为证人。 证人目前在所有校长都在的网站上运行。

    1. 我从来没有见过集群发生故障。 镜像失败的速度很快,我最多说10秒左右。

    2. 合伙人超时是所有数据库的30秒

    3. 在devise上,在集群故障切换之前将发生镜像故障切换。 虽然每个实例都被configuration为只使用服务器上可用RAM的一半,但是数据库仅作为附加级别的冗余进行聚集。