我在Centos Linux上安装了Heartbeat,似乎部分工作..但我试图监视一个没有成功的服务。 只有当我重启主服务器时,备份服务器才会接pipe。 在我得到的日志中:
heartbeat[30476]: 2012/03/20_18:51:57 WARN: string2msg_ll: node [node1] failed authentication heartbeat[30476]: 2012/03/20_18:51:58 WARN: string2msg_ll: node [node02] failed authentication
authkeys是相同的(从一个复制到另一个)。 这是我的ha.cf:
logfile /var/log/ha-log logfacility local0 keepalive 2 deadtime 30 initdead 120 bcast eth0 udpport 694 auto_failback on node server01.com node server02.com
haresources:
server01.com 38.108.117.3 aim chat
任何想法如何解决这个问题,所以如果服务停止其他服务器接pipe谢谢! E.
您正在使用heartbeat v1语法。 如果你使用这个,将不会进行监控(默认情况下)。 如果你想监控,你将不得不转换为V2语法(XML),并将不得不添加监控方法。
关于你的configuration的其他一些说明:
现在回到最初的问题:这看起来好像其他节点(来自不同的集群?)尝试在相同的广播IP和相同的UDP端口上进行通信。
“您的”节点是“server01.com”和“server02.com” – 您会看到另外两个节点(“node1”和“node02”)。
更新:如何configuration单播:
RTFM(阅读精细手册) rpm -qd|grep "ha.cf" :
# Set up a unicast / udp heartbeat medium # ucast [dev] [peer-ip-addr] # # [dev] device to send/rcv heartbeats on # [peer-ip-addr] IP address of peer to send packets to # #ucast eth0 192.168.1.2
要监视和故障切换服务(而不只是盒子),您将需要完整的Pacemaker / Corosync / Heartbeat设置,而不仅仅是基本的心跳。 如果您使用haresources,则使用基本的心跳。
从EPEL安装可以在这里find:
ClusterLabs wiki将有其他文档为特定服务configurationPacemaker。