我正在与Pacemaker和Stonith一起使用双节点群集(节点称为A和B)以实现高可用性。 两个节点都有一个IPMI作为fence设备。
交易是:
然后我断开A节点的供应。 所以A上的每个eth接口和IPMI都不可用。 这里有个诀窍:B试图使A失败,导致A的IPMI无法访问。 当N次尝试完成后,B放弃并进入“Block”状态(在日志文件中称为IDLE)。
这是我的问题:即使史东尼斯A失败,我怎么能强制B拿回资源呢?
我了解后果(并发写入等),但我更喜欢这些相比,根本不可用的服务。
你已经有这个问题了:
B尝试失败使A失效,导致A的IPMI无法访问。
除非B能够完成一次成功的围栏操作,否则会挂起以避免裂脑情况。 您可以通过configuration辅助防护机制来缓解这种情况。