Articles of corosync

可以在Pacemaker组中设置资源的具体顺序吗?

鉴于下面描述的Pacemaker / Corosync资源configuration,是否可以在资源组内的特定位置添加资源? configuration是使用RHEL提供的集群附件的CentOS 7.2。 这是一个NFS服务器集群,Pacemaker处理NFS守护进程,卷,导出,虚拟IP和NFS客户端通知。 当我想要将NFS挂载(exportfs资源)添加到群集设置时,它会在nfs-notify资源之后列出。 这以丑陋的方式打破了集群。 我find了基本的pcs resource order命令,这似乎允许指定资源X需要在资源Y之前运行 ,但这不是可伸缩的。 这可能吗? [root@zfs1-node1 ~]# pcs status Cluster name: zfs1 Last updated: Tue Jan 5 04:09:11 2016 Last change: Tue Jan 5 04:08:15 2016 by root via cibadmin on zfs1-node1 Stack: corosync Current DC: zfs1-node1 (version 1.1.13-10.el7-44eb2dd) – partition with quorum 2 nodes and 9 […]

Corosync的安全IPTables规则

我有两个运行Corosync和Pacemaker的HA负载均衡器( hollywood和狼人)。 eth1接口连接到WAN, eth0连接到LAN,使用虚拟IP作为后端服务器的网关。 hollywood的eth1 IP为xxx.xxx.195.45 , wolfman的eth1 IP为xxx.xxx.195.46 。 bindnetaddr中的bindnetaddr是xxx.xxx.195.32 ,与WAN的networking地址相同,Corosync端口是默认的5405 。 两台服务器上的相关IP表规则是: *filter –flush :INPUT DROP –append INPUT –protocol udp –destination-port 5404 –jump ACCEPT –append INPUT –protocol udp –destination-port 5405 –jump ACCEPT 这个设置似乎工作正常,但最初我添加了–in-interface eth1和–source xxx.xxx.195.46给wolfman ,并且 – 把–source xxx.xxx.195.45为hollywood 。 大多数情况下,这似乎工作,但重新启动被动平衡器有时会中断负载平衡器之间的通信,将这些错误写入syslog: [TOTEM]由于操作系统或networking故障,Totem无法形成群集。 此消息最常见的原因是本地防火墙configuration不正确。 所以看来,无论我简单地相信所有Corosyncstream量直接在eth1的两个负载均衡器之间是错误的,还是其他问题正在导致问题。 我想locking在IPTables端口5404/5405只是集群。 我需要做些什么才能做到这一点? 按要求编辑: corosync.conf 。 这是除bindnetaddr之外的所有默认Ubuntu。 # Please read […]

资源转移之前的起搏器/ corosync超时

这似乎是一个简单的问题,但我似乎无法find答案,尽pipe经过了多次的起搏器文档。 我已经与起搏器设置了corosync来共享虚拟IP。 我所要做的就是在备份节点接pipe资源之前设置超时值。 在networking中断时间<1-2分钟时,我想让起搏器继续正常工作,而不是触发故障切换,但是如果中断超过一定数量,请将其切换。 资源超时 – 但是这似乎是等待资源启动的超时,而不是整个群集。

MySQL:起搏器不能作为一个新的奴隶启动失败的主人?

起搏器1.0.12-1 corosync-1.2.7-1.1 我要为MySQL复制设置故障转移(1个主站和1个从站),请遵循以下指南: https : //github.com/jayjanssen/Percona-Pacemaker-Resource-Agents/blob/master/doc/PRM-setup-guide .rst 这里是crm configure show的输出: node serving-6192 \ attributes p_mysql_mysql_master_IP="192.168.6.192" node svr184R-638.localdomain \ attributes p_mysql_mysql_master_IP="192.168.6.38" primitive p_mysql ocf:percona:mysql \ params config="/etc/my.cnf" pid="/var/run/mysqld/mysqld.pid" socket="/var/lib/mysql/mysql.sock" replication_user="repl" replication_passwd="x" test_user="test_user" test_passwd="x" \ op monitor interval="5s" role="Master" OCF_CHECK_LEVEL="1" \ op monitor interval="2s" role="Slave" timeout="30s" OCF_CHECK_LEVEL="1" \ op start interval="0" timeout="120s" \ op stop interval="0" timeout="120s" […]

Heartbeat,Pacemaker和CoroSync的替代品?

除了典型的Heartbeat / Pacemaker / CoroSync组合以外,Linux上是否有自动故障切换的主要select? 特别是,我在EC2实例上设置了故障转移,它仅支持单播 – 不允许多播或广播。 我正在专门处理那些还没有自动故障转移function的软件,而且不支持多主环境。 这包括HAProxy和Solr等工具。 我有心跳+起搏器工作,但我不感到激动。 以下是我的一些问题: 心跳 – 本身,限于两个节点。 我想要3+。 起搏器 – 不可能自动configuration。 群集必须以法定人数运行,然后仍需要手动configuration。 CoroSync – 不支持单播。 起搏器工作得很好,虽然它的功率很难安装。 Pacemaker的真正问题是没有简单的方法来自动化configuration。 我真的想要启动一个EC2实例,安装Chef / Puppet,让整个集群不需要我介入就可以启动。