首先closures所有在启动器/ corosync故障转移群集中运行Fedora 19的2个虚拟机,他们有1个运行Fedora 19的群集IP 1虚拟机监控虚拟机的nagios 现在nagios在两个节点上都在运行,但是我希望nagios只在当前活动的节点上运行。 有人可以帮我吗? Current DC: pcmk-2(3232249960) – partition with quorum Version: 1.1.9-3.fc19-781a388 2 Nodes configured, unknown expected votes 1 Resources configured. Online: [pcmk-1 pcmk-2] CLUSTERIP (ofc::heartbeat:IPaddr2): Started pcmk-2 [root@pcmk-1]crm_resuorce -L CLUSTERIP (ofc::heartbeat:IPaddr2): Started
我正在安装具有故障转移容量的高可用性CentOS(5.x)设置程序,我在两个不同的位置有两个相同的XEN VPS,每个VPS都有一个专用IP和一个公用IP,我正在使用专用IP在每个节点上为磁盘副本DRBD和两个节点都使用IPSec隧道进行私有层面的连接,现在我正在考虑使用STONITH作为沿Pacemaker和Corosync的防护机制进行集群,但是我对集群IP的整体思路感到困惑(浮动地址),我应该准确地把域NS服务器放在域级别,我的设置有2个节点只有2个专用的DNS服务器,我知道浮动IP不应该属于群集中的任何节点(据我所知),这个孤独的IP地址怎么能知道这两个节点? 任何逻辑提示将是伟大的!
我在CentOS 7上有一个Clustered Loadbalancer(起搏器,corosync,apache 2.4)。有两个configuration文件,一个用于实际的平衡站点,一个用于平衡器pipe理器。 当我访问平衡器pipe理器站点时,它实际上显示一个空的页面( 负载平衡器pipe理器为10.0.0.20 …..服务器版本,服务器版本—————– – END ),就像这样 – 但是无论我把SetHandler指令(直接放到vhost1.conf,httpd.conf等)中,它都保持不变。 我也得到一个HTTP 200在请求日志。 vhost1.conf: <Virtualhost xxxx:443> SSLEngine On ….. ….. <Proxy balancer://mycluster> ProxySet failonstatus=503 BalancerMember http://10.0.0.21 loadfactor=5 connectiontimeout=2 retry=600 BalancerMember http://10.0.0.22 loadfactor=5 connectiontimeout=2 retry=600 BalancerMember http://10.0.0.23 loadfactor=1 connectiontimeout=2 retry=600 ProxySet lbmethod=bybusyness </Proxy> ProxyPass /myservices/ balancer://mycluster/myservices/ ProxyPassReverse /myservices/ balancer://mycluster/myservices/ </VirtualHost> vhost2.conf: Listen 10.0.0.20:8008 <VirtualHost 10.0.0.20:8008> […]
我在一个安全的环境中设置了一个DRBD安装的Pacemaker / Corosync集群,以获得高度可用的Web应用程序。 这在CentOS 7上运行。群集正在工作。 但是为了让这个系统准备好进行安全审计,我必须禁止所有的应用程序监听IPV6并强制IPV4。 我已经在全系统禁用了IPV6: # Contents of /etc/sysctl.conf net.ipv6.conf.all.disable_ipv6 = 1 我已经在networking层面上完成了禁用IPV6的额外步骤: # Contents of /etc/sysconfig/network NETWORKING_IPV6=no IPV6_AUTOCONF=no 但是PCSD坚持要监听IPV6端口: # netstat -lnptu Active Internet connections (only servers) Proto Recv-Q Send-Q Local Address Foreign Address State PID/Program name tcp 0 0 0.0.0.0:22 0.0.0.0:* LISTEN 1206/sshd tcp 0 0 127.0.0.1:25 0.0.0.0:* LISTEN 1837/master tcp6 […]
我看到: 这个问题 。 192.168.2.0/24 – 与GW的办公室networking。 .2.1 根据Corosync文档,如果本地接口为192.168.5.67,networking掩码为255.255.255.0,则将bindnetaddr设置为192.168.5.0。 corosync.conf totem { version: 2 crypto_cipher: none crypto_hash: none interface { ringnumber: 0 bindnetaddr: 192.168.2.0 mcastaddr: 239.255.1.1 mcastport: 5405 ttl: 1 } } logging { fileline: off to_stderr: no to_logfile: yes logfile: /var/log/cluster/corosync.log to_syslog: yes debug: off timestamp: on logger_subsys { subsys: QUORUM debug: off } } […]
我有一个标准的2节点HAproxy负载平衡器设置与起搏器1.1(使用PC)和haproxy 1.5。 我有2个浮动IP地址与haproxy服务作为haproxy克隆资源的约束。 我需要在hparoxy-clone服务上添加一个具有相同约束的新的浮动IP。 我的第一个问题是,当我创build浮动IP资源,它开始在没有其他IP地址的节点上。 然后我运行pcs constraint colocation add haproxy-clone with floatIP_189 (floatIP_189是我的新地址)。 这不会将IP地址移动到其他节点,并且haproxy克隆资源将停止。 我可以通过重新启动两个节点上的起搏器服务来重新启动haproxy服务。 如何在不降低stream量的情况下向起搏器添加新的浮动IP,否则会中断负载平衡器上的其他站点。 下面是haproxy.cfg文件,pcs status命令的输出和pcs config命令的输出; [root@t-haproxylb3 haproxy]# cat haproxy.cfg peers QAHAproxypeers peer t-haproxylb3 10.xx185:1024 peer t-haproxylb4 10.xx186:1024 global log 127.0.0.1 local0 # log /dev/log local0 # log /dev/log local1 notice chroot /var/lib/haproxy stats socket /var/lib/haproxy/stats stats timeout 30s tune.ssl.default-dh-param 2048 user […]
我有Corosync + Pacemaker的下一个场景 节点1: eth0:10.143.0.21/24 eth1:10.10.10.1/30(Corosync通信) eth2:192.168.5.2/24 节点2: eth0:10.143.0.22/24 eth1:10.10.10.2/30(Corosync通信) eth2:192.168.5.3/24 浮动IP的 eth0:10.143.0.23/24 eth2:192.168.5.1/24 接口eth1仅用于corosync通信。 例如我断开networking电缆从接口eth0,但没有任何反应,其他例子我断开networking电缆从接口eth2,我有相同的结果,但我断开networking电缆从接口eth1(corosync通信)和浮动IP的传递到其他节点。 断开资源传递到另一个节点的任何接口时,我该如何做? 问候 UPDATE 我testing了以下设置 crm configure primitive PING-WAN ocf:pacemaker:ping params host_list="10.143.0.1" multiplier="1000" dampen="1s" op monitor interval="1s" crm configure primitive Failover-WAN ocf:heartbeat:IPaddr2 params ip=10.143.0.23 nic=eth0 op monitor interval=10s meta is-managed=true crm configure primitive Failover-LAN ocf:heartbeat:IPaddr2 params ip=192.168.5.1 nic=eth2 op monitor […]
我有以下结构: 2个节点。 corosync +起搏器+ DRBD + OCFS2。 ============== 在testingnetworking失败后,状态从DRBD变成: ****小学/未知**** dmesg显示以下内容: 裂脑检测到但未解决,断开连接。 我可以通过命令手动从DRBD到主/主返回的状态,但我希望自动。 我的configuration是: / etc / corosync / r0 resource r0 { protocol C; startup { become-primary-on both; } disk { on-io-error detach; fencing resource-only; resync-rate 1000M; } handlers { split-brain "/usr/lib/drbd/notify-split-brain.sh root"; fence-peer "/usr/lib/drbd/crm-fence-peer.sh"; after-resync-target "/usr/lib/drbd/crm-unfence-peer.sh"; } net { allow-two-primaries yes; cram-hmac-alg sha1; […]
我需要configuration共享GFS2文件系统的3节点群集。 平衡器后面的apache需要GFS2作为普通的Documentroot。 你能提出一些关于如何在RHEL / SL 6.1上configurationcorosync + pacemaker + GFS2的指南吗? 顺便说一句,我不需要DRBD,因为我有iSCSI作为共享块设备。
我目前正在研究corosync来build立一个双节点集群。 所以,我已经做得很好,它做我想做的,这是: 两个节点之间丢失的连接使得第一个节点的“10node”都是故障切换WAN IP。 (又名资源WanCluster100和WanCluster101) “11节点”什么都不做。 他“认为”他仍然有他的故障转移湾IP。 (又名WanCluster101) 但它不这样做: 当与其他节点的连接恢复时,'11节点'应该重新启动WanCluster101资源。 这是为了防止节点10简单地死亡(并且因此不获得11节点的故障转移Wan IP)的情况,导致没有节点具有10节点的故障转移IP的情况,因为10节点处于closures状态。11节点已经“给出”其故障转移Wan IP。 这是当前正在configuration的configuration。 node 10sch \ attributes standby="off" node 11sch \ attributes standby="off" primitive LanCluster100 ocf:heartbeat:IPaddr2 \ params ip="172.25.0.100" cidr_netmask="32" nic="eth3" \ op monitor interval="10s" \ meta is-managed="true" target-role="Started" primitive LanCluster101 ocf:heartbeat:IPaddr2 \ params ip="172.25.0.101" cidr_netmask="32" nic="eth3" \ op monitor interval="10s" \ meta is-managed="true" […]