在SQL Server中组合故障转移群集和数据库镜像时,需要更改镜像伙伴超时值,以便本地群集有机会在数据库镜像失败之前进行故障转移。 我很好奇在把这些技术结合起来的时候人们在做什么 – 我教各种HA类,这不是很常见的组合。
这是我的问题,如果你正在使用故障转移群集和数据库镜像相结合。 如果你能在每个回答中回答他们,那对我来说是非常有用的。 我不需要解释为什么需要改变什么东西或者技术是如何工作的 – 我曾经在微软拥有它们 – 我对工业界的做法感兴趣,现在可以和他们结婚了4年。
1)平均需要多长时间才能为群集SQL Server实例进行故障转移? (我知道这取决于需要多less崩溃恢复,但什么是平均水平?)
2)对于这些相同的实例,您将镜像伙伴超时设置为什么?
3)对于真正的集群中断可能发生的事实,您感到满意吗?可能需要一段时间,直到镜像发现由于您已经使镜像伙伴超时而失败。
感谢所有的回应!
保罗,1.通常几秒钟,长达几分钟取决于…(你知道其余的)。
如果我设置自动故障转移,我会去几分钟。 这种方式站点到站点的VPN连接将有时间来恢复,群集可以重新启动等等。至less我可能会用4分钟的时间比在集群节点重新启动时停电。
是的。 DR问题通常被定义为一个小时以上的失败。 此外,可能需要比全球负载平衡器更长的时间才能注意到其他站点已closures,并且上传所有的DNS以及DNS上的TTL时间。 这个总时间应该是自动故障转移时间的上限。
我没有参与原始devise,但这是如何设置的:
每个站点还有一个独立的服务器,可以作为证人。 证人目前在所有校长都在的网站上运行。
我从来没有见过集群发生故障。 镜像失败的速度很快,我最多说10秒左右。
合伙人超时是所有数据库的30秒
在devise上,在集群故障切换之前将发生镜像故障切换。 虽然每个实例都被configuration为只使用服务器上可用RAM的一半,但是数据库仅作为附加级别的冗余进行聚集。