在Centos Linux上configurationHeartbeat – 错误消息

我在Centos Linux上安装了Heartbeat,似乎部分工作..但我试图监视一个没有成功的服务。 只有当我重启主服务器时,备份服务器才会接pipe。 在我得到的日志中:

heartbeat[30476]: 2012/03/20_18:51:57 WARN: string2msg_ll: node [node1] failed authentication heartbeat[30476]: 2012/03/20_18:51:58 WARN: string2msg_ll: node [node02] failed authentication 

authkeys是相同的(从一个复制到另一个)。 这是我的ha.cf:

 logfile /var/log/ha-log logfacility local0 keepalive 2 deadtime 30 initdead 120 bcast eth0 udpport 694 auto_failback on node server01.com node server02.com 

haresources:

 server01.com 38.108.117.3 aim chat 

任何想法如何解决这个问题,所以如果服务停止其他服务器接pipe谢谢! E.

您正在使用heartbeat v1语法。 如果你使用这个,将不会进行监控(默认情况下)。 如果你想监控,你将不得不转换为V2语法(XML),并将不得不添加监控方法。

关于你的configuration的其他一些说明:

  • 自动故障回复从来就不是一个好主意。 你可以创build一个不错的“乒乓球”
  • 只有两个节点的广播不是一个好主意。 改用ucast。
  • 只有一个networking连接? 玩得开心,大脑分裂。

现在回到最初的问题:这看起来好像其他节点(来自不同的集群?)尝试在相同的广播IP和相同的UDP端口上进行通信。

“您的”节点是“server01.com”和“server02.com” – 您会看到另外两个节点(“node1”和“node02”)。

  • 为每个群集使用不同的UDP端口
  • 使用单播而不是广播(见上文)。

更新:如何configuration单播:

RTFM(阅读精细手册) rpm -qd|grep "ha.cf"

 # Set up a unicast / udp heartbeat medium # ucast [dev] [peer-ip-addr] # # [dev] device to send/rcv heartbeats on # [peer-ip-addr] IP address of peer to send packets to # #ucast eth0 192.168.1.2 

要监视和故障切换服务(而不只是盒子),您将需要完整的Pacemaker / Corosync / Heartbeat设置,而不仅仅是基本的心跳。 如果您使用haresources,则使用基本的心跳。

从EPEL安装可以在这里find:

http://www.clusterlabs.org/wiki/Install#Installing_on_EPEL-5_Compatible_Distributions:_RHEL.2C_CentOS.2C_etc

ClusterLabs wiki将有其他文档为特定服务configurationPacemaker。