Articles of corosync

corosync无法安装

我试图在RHEL6上使用corosync和pacemaker设置集群(CentOS 6.5版) 我已经添加了以下回购数据 [haclustering] name=HA Clustering type=rpm-md baseurl=http://download.opensuse.org/repositories/network:/ha-clustering:/Stable/RedHat_RHEL-6/ gpgcheck=1 gpgkey=http://download.opensuse.org/repositories/network:/ha-clustering:/Stable/RedHat_RHEL-6/repodata/repomd.xml.key enabled=1 我试图安装默认启用回购(启用= 1),禁用回购和使用–enablerepo选项,而只安装pacemaker和corosync。 似乎有依赖关系的问题,我有错误消息如下: Error: Package: pacemaker-1.1.12+git20140723.483f48a-1.1.x86_64 (haclustering) Requires: libcoroipcc.so.4()(64bit) Available: corosynclib-1.4.1-17.el6.x86_64 (base) libcoroipcc.so.4()(64bit) Available: corosynclib-1.4.1-17.el6_5.1.x86_64 (updates) libcoroipcc.so.4()(64bit) Available: corosynclib-2.3.3-1.1.i686 (haclustering) Not found Error: Package: pacemaker-1.1.12+git20140723.483f48a-1.1.x86_64 (haclustering) Requires: libcfg.so.4(COROSYNC_CFG_0.82)(64bit) Available: corosynclib-1.4.1-17.el6.x86_64 (base) libcfg.so.4(COROSYNC_CFG_0.82)(64bit) Available: corosynclib-1.4.1-17.el6_5.1.x86_64 (updates) libcfg.so.4(COROSYNC_CFG_0.82)(64bit) Available: corosynclib-2.3.3-1.1.i686 (haclustering) Not found Error: Package: pacemaker-1.1.12+git20140723.483f48a-1.1.x86_64 […]

drbd corosync集群第二个节点试图成为主要的所有时间

我们正在面对与drbd corosync群集的问题。 在主要所有资源(mysql服务,drbd)的一个节点上工作正常。 但是第二个节点总是试图成为主要的。 第二个节点的错误日志如下所示: lrmd: [25272]: info: RA output: (mysql-drbd:0:promote:stderr) 0: State change failed: (-1) Multiple primaries not allowed by config Oct 1 16:39:39 node2 lrmd: [25272]: info: RA output: (mysql-drbd:0:promote:stderr) 0: State change failed: (-1) Multiple primaries not allowed by config Oct 1 16:39:39 node2 lrmd: [25272]: info: RA output: (mysql-drbd:0:promote:stderr) Command 'drbdsetup […]

Corosync 2.3.3:无法启用密码

我试图build立一台新的起搏器/ corosync 2台机器。 我以前用corosync1来使用它,但是在Ubuntu 14.04上,我已经有了corosync 2.3.3好了 – 我说了,并试图使用这个版本的软件。 当我准备一个戒指的基本configuration – 一切都很好。 节点是可见的,一切工作都很好。 我想要做的是启用节点之间的encryption。 文档不是很有帮助;或者我可能太愚蠢了;) 。 如何在corosync上启用密码? 在手册我们可以阅读: crypto_hash This specifies which HMAC authentication should be used to authenticate all messages. Valid values are none (no authentication), md5, sha1, sha256, sha384 and sha512. The default is sha1. crypto_cipher This specifies which cipher should be used to […]

Corosync / Pacemaker + Haproxy失败操作:权限不足

我在Ubuntu 14.04 LTS上使用以下指南设置Corosync / Pacemaker集群+ HAproxy: http : //www.sebastien-han.fr/blog/2012/04/15/active-passive-failover-cluster-on-a-的MySQL-加莱拉群集与- HAProxy的-LSB剂/ 我没有添加虚拟IP设置,只有两个节点,都安装了Haproxy。 我正在使用lsb:haproxy,我的configuration如下: 为了testing一切,我运行以下命令来终止haproxy进程:sudo kill -9 [PID#] 然后,我检查群集的状态并收到以下错误消息:“失败的操作:权限不足”。 我没有更改haproxy用户/组定义,我的aisexec {}对用户和组都使用root。 如果我想让Corosync / Pacemakerpipe理Haproxy,我的权限应该是什么? 编辑:当我运行下面的服务停止命令,haproxy按预期重新启动。 检查crm status haproxy守护进程正常运行 # sudo service haproxy stop # sudo crm status HaproxyHA (lsb:haproxy): Started node1 Failed Actions: 但是当我手动杀死pid时,我一直看到错误: # sudo kill -9 $PID HaproxyHA (lsb:haproxy): Started node1 (unmanaged) FAILED Failed Actions: […]

在云服务器上的Corosync

我在云上有两台Oracle Linux 7服务器,我想使用Corosync。 服务器位于同一个云networking(不是LAN)上,但它们只有一个networking。 这里是conf文件。 服务器A: totem { version: 2 secauth: off transport: udpu crypto_cipher: none crypto_hash: none interface { member { memberaddr: xyzi } member { memberaddr: xyzj } ringnumber: 0 bindnetaddr: xyzi mcastport: 5405 ttl: 1 } } logging { fileline: off to_stderr: no to_logfile: yes logfile: /var/log/cluster/corosync.log to_syslog: yes debug: off timestamp: […]

起搏器corosynce lsb资源脚本(Sybase数据库ASE服务器和备份服务器)

我试图在rhel7.2上用pcs创build一个lsb资源“sybase”脚本是关于Sybase数据库ASE服务器和备份服务器启动和停止并重新启动$ status脚本 之前 [root@pldbsv01 ~]# pcs status Cluster name: PLDBSV_CLUSTER Last updated: Tue Apr 19 23:18:44 2016 Last change: Tue Apr 19 22:59:07 2016 by root via cibadmin on pldbsv02-cr Stack: corosync Current DC: pldbsv02-cr (version 1.1.13-10.el7-44eb2dd) – partition with quorum 2 nodes and 9 resources configured Online: [ pldbsv01-cr pldbsv02-cr ] Full list of […]

使用clone和clusterip启动pacemaker虚拟ip负载平衡

我正在尝试为一组natted机器制作一个负载均衡的网关。 我有3个centos节点。 最初只有一个节点应该有内部网关IP,并且运行良好。 交通stream量。 然后,我尝试通过clusterip_hash / clone选项来平衡网关。 在底部有一个资源创build与个人电脑,我的小地点限制(不要移动IP到一台没有“互联网”的机器),最后是克隆命令。 一旦我克隆资源,我可以看到他们在两个主机上正确运行,并且每个都添加了iptables规则: Chain INPUT (policy DROP) target prot opt source destination CLUSTERIP all — anywhere gateway CLUSTERIP hashmode=sourceip-sourceport clustermac=81:48:85:71:7F:47 total_nodes=2 local_node=2 hash_init=0 问题是,只要arp条目从当前的任一网关机器的真实物理mac改变到iptables中显示的clustermac,所有的natted机器就会松动互联网连接。 我添加iptableslogging丢弃的数据包,但似乎没有丢弃。 同时,似乎没有任何事情可以通过。 (10.10.0.52是一个随机挑选的natted主机,试图ping谷歌,如果虚拟IP克隆被删除,并改变为单个浮动IP,然后stream量再次stream动) [root@three ~]# tcpdump -nni enp1s0 icmp tcpdump: verbose output suppressed, use -v or -vv for full protocol decode listening on enp1s0, link-type […]

corosync的高可用性和DNS的负载平衡

我有一个2个节点的HA集群。 这个集群将使用浮动IP地址,比如说:10.10.10.100 问题是,在这种情况下可以使用DNS负载平衡吗? 例如:host.com是我的2个节点的域名。 host.com将是host-ha.com的别名,Alogging是浮动IP地址:10.10.10.100。 host-ha.com将成为host.dns.com的别名,其中2个Alogging存在10.10.10.101和10.10.10.102。 负载平衡会以这种方式工作吗? 我知道这是一个丑陋的方式,但对我来说这是一个有趣的尝试。 谢谢!

编辑HA群集configurationcib.xml

我想编辑生活在centos6.5上的集群configuration的pingd,因为地址不再有效,而且由于节点失败,我的集群总是切换到另一个节点。最好的办法是做什么。我知道我绝对不能打开直接cib.xml文件。 [root@PBX1 mojo]# pcs config Cluster Name: pbx Corosync Nodes: pbx1 pbx2 Pacemaker Nodes: pbx1 pbx2 Resources: Master: master_drbd Meta Attrs: master-max=1 master-node-max=1 clone-max=2 clone-node-max=1 notify=true Resource: drbd_drbd0 (class=ocf provider=linbit type=drbd) Attributes: drbd_resource=drbd0 Operations: monitor interval=10s (drbd_drbd0-monitor-interval-10s) Clone: Connectivity Resource: p_ping (class=ocf provider=pacemaker type=ping) Attributes: host_list="10.66.4.4 10.66.4.5 10.66.4.11 10.66.4.252 10.66.4.253 10.66.4.254" multiplier=1000 dampen=5s Operations: monitor […]

起搏器对资源的位置限制显然不服从

我有两个STONITH资源的Pacemaker设置。 他们有位置约束, crm configure show列表如下: location loc_stonith_node1 stonith_node1 rule -inf: #id eq node1 location loc_stonith_node2 stonith_node2 rule -inf: #id eq node2 然而, crm status表明两个资源都在node2上启动: stonith_node1 (stonith:external/ipmi): Started node2 stonith_node2 (stonith:external/ipmi): Started node2 如果我crm resource stop ,然后crm resource start这两个资源甚至持续这种情况。 有什么可以解释的位置约束显然不服从? 更新如果我crm resource migrate stonith_node2 node1资源启动node1 ,但如果我然后crm resource unmigrate stonith_node2它立即弹回到node2 。