在Centos Linux上configurationHeartbeat – 错误消息

我在Centos Linux上安装了Heartbeat，似乎部分工作..但我试图监视一个没有成功的服务。只有当我重启主服务器时，备份服务器才会接pipe。在我得到的日志中：

heartbeat[30476]: 2012/03/20_18:51:57 WARN: string2msg_ll: node [node1] failed authentication heartbeat[30476]: 2012/03/20_18:51:58 WARN: string2msg_ll: node [node02] failed authentication

authkeys是相同的（从一个复制到另一个）。这是我的ha.cf：

 logfile /var/log/ha-log logfacility local0 keepalive 2 deadtime 30 initdead 120 bcast eth0 udpport 694 auto_failback on node server01.com node server02.com

haresources：

 server01.com 38.108.117.3 aim chat

任何想法如何解决这个问题，所以如果服务停止其他服务器接pipe谢谢！ E.

您正在使用heartbeat v1语法。如果你使用这个，将不会进行监控（默认情况下）。如果你想监控，你将不得不转换为V2语法（XML），并将不得不添加监控方法。

关于你的configuration的其他一些说明：

自动故障回复从来就不是一个好主意。你可以创build一个不错的“乒乓球”
只有两个节点的广播不是一个好主意。改用ucast。
只有一个networking连接？玩得开心，大脑分裂。

现在回到最初的问题：这看起来好像其他节点（来自不同的集群？）尝试在相同的广播IP和相同的UDP端口上进行通信。

“您的”节点是“server01.com”和“server02.com” – 您会看到另外两个节点（“node1”和“node02”）。

为每个群集使用不同的UDP端口
使用单播而不是广播（见上文）。

更新：如何configuration单播：

RTFM（阅读精细手册） rpm -qd|grep "ha.cf" ：

 # Set up a unicast / udp heartbeat medium # ucast [dev] [peer-ip-addr] # # [dev] device to send/rcv heartbeats on # [peer-ip-addr] IP address of peer to send packets to # #ucast eth0 192.168.1.2

要监视和故障切换服务（而不只是盒子），您将需要完整的Pacemaker / Corosync / Heartbeat设置，而不仅仅是基本的心跳。如果您使用haresources，则使用基本的心跳。

从EPEL安装可以在这里find：

http://www.clusterlabs.org/wiki/Install#Installing_on_EPEL-5_Compatible_Distributions:_RHEL.2C_CentOS.2C_etc

ClusterLabs wiki将有其他文档为特定服务configurationPacemaker。