我一直在努力理解Heartbeat是如何工作的 – 我明白当一台服务器死亡时,它将切换到备份。 但是,对于我来说,当主服务器的工作负载大量增加时,它也会发生切换。 但是,它并不总是以相同的值切换。 networking上似乎没有太多关于它如何工作的信息。 我发现的最好的就是这篇文章 。
心跳是如何决定何时切换到次要的,以及如何决定何时切换回到主要的? 这是一个可编辑的设置,我可以强制它之间切换? 有时当心跳将转换到次要的,这需要几天,或者我已经看到两个星期之前,切换回主要。 这主要是在主要交通stream量下降之后。
我目前正在使用BlueOnyx,而我的心跳设置是:
Auto Failback: on Keepalive: 1 seconds Warntime: 10 seconds Deadtime: 20 seconds Initdead: 30 seconds
正常情况下,如果所有心跳线,ping节点和ping组都closures(或者如果心跳认为它们已closures),则心跳将失败。
在你的设置这将发生20年后没有任何这些方法的反应。
我无法回答你关于自动故障回复的问题,因为我总是把它关掉以避免ping-pongs。
如果需要进行故障切换,请删除故障切换的原因,然后手动进行故障切换(在计划的停机时间)。