本文保留您应该使用击剑(又名STONITH)和冗余通信链接。 我试图了解STONITH在裂脑的情况下给了什么好处。 例如,考虑使用交换机I连接节点A,节点B,STONITH设备。如果交换机I死亡 – networking被分区 – 并且节点A不能向STONITH设备发送请求,那么它是无用的。
好的,我们可能有专用的开关II连接节点与STONITH设备。 如果开关I发生故障,我们仍然可以向STONITH设备发送信号,并可能closures节点B.
但问题是,为什么不使用交换机II作为节点A和节点B之间的冗余通信path? 如果交换机I发生故障,您仍然可以使用交换机II,无需closures节点B.
这个想法是,当你的集群决定它需要故障转移一个节点时,那个节点肯定会出现问题。
击剑,击中头部另一个节点(STONITH)是最好的保证,失败的节点将释放它所持有的所有资源,而且如果问题是软件相关的话,它将通过硬复位来固定,是一个不错的奖金…
您通常会build立一个集群,因为集群服务不支持并发运行,而且当两个实例同时运行时,事情会变得非常糟糕。 很多努力去防止这一点。 作为集群devise人员,高可用性通常在您的优先事项上遥遥领先。