Articles of 起搏器

监测起搏器与url触发外部代理

我有一个HA设置,现在唯一configuration的资源是主动/被动configuration的心跳。 在云中运行Debian 7,64位。 现在我想在资源发生变化时触发一个来自Pacemaker的信息。 URL指向某个将发送电子邮件/ SMSalert的服务器。让URL触发为http://example.com/pacemaker.php?CRM_notify_node=node1&CRM_notify_rsc=blah 由于configurationPacemaker的所有东西是乏味的。 所以所有的处理或发送电子邮件/警报被放入网页。 那么,如何configurationPacemaker来调用URL。 谢谢

DRBD与起搏器失败

我是Pacemaker和DRBD的新手,但我必须将它们configuration在一起。 我创build了2个drbd资源:Drbdwww和DrbdMysql但是,当我使用drbd_mon我有以下错误: Stack: corosync Current DC: s-ha-web1 (version 1.1.15-e174ec8) – partition with quorum Last updated: Mon May 8 21:58:45 2017 Last change: Mon May 8 21:58:36 2017 by hacluster via crmd on s-ha-web1 2 nodes and 7 resources configured Online: [ s-ha-web1 s-ha-web2 ] Resource Group: haweb vip (ocf::heartbeat:IPaddr2): Started s-ha-web1 httpd (ocf::heartbeat:apache): Started s-ha-web1 […]

corosync pacemaker crm状态显示DC:无和离线

我是corosync和pacemaker的新手,尝试使用vm node1和node2构build集群。 这里是/etc/corosync/corosync.conf # Please read the corosync.conf.5 manual page compatibility: whitetank totem { version: 2 secauth: off interface { member { memberaddr: 192.168.1.101 } member { memberaddr: 192.168.1.102 } ringnumber: 0 bindnetaddr: 192.168.1.100 mcastport: 5405 ttl: 1 } transport: udpu } logging { fileline: off to_logfile: yes to_syslog: yes #logfile: /var/log/cluster/corosync.log debug: off timestamp: […]

如何在起搏器中设置资源粘性?

我正在玩红帽的高可用性附加,一切似乎工作正常,但我有一个问题: 每当我重新启动一个节点7test2 ,资源组g1迁移到7test1 (devise),然后当7test2回来在线资源组g1迁移回来,就像它有某种粘性或东西。 [root@7test1 ~]# cat /etc/redhat-release Red Hat Enterprise Linux Server release 7.1 (Maipo) [root@7test1 ~]# rpm -q pcs pcs-0.9.137-13.el7.x86_64 [root@7test1 ~]# pcs status Cluster name: 7test Last updated: Thu Apr 23 17:11:10 2015 Last change: Thu Apr 23 17:00:02 2015 Stack: corosync Current DC: 7test1.uftwf.local (1) – partition with quorum Version: 1.1.12-a14efad […]

NFS v4,HA迁移和客户端上的陈旧句柄

我正在使用Pacemaker / OpenAISpipe理运行NFS v4的服务器。 NFSconfiguration为使用TCP。 当我将NFS服务器迁移到Pacemaker集群中的另一个节点时,即使元数据保持不变,客户端的挂起连接也会在90秒后超时。 在90秒之后,旧的挂载点变成“陈旧”,挂载的文件不能再被访问。 90秒宽限期似乎是服务器configuration的一部分,而不是客户端configuration。 我在服务器上看到这个消息: 内核:NFSD:启动90秒的宽限期 如果我在迁移(卸载,然后重新安装共享)后重新启动客户端节点上的NFS客户端,然后我没有遇到问题,但连接和文件传输仍然中断。 三个问题: 什么是90秒的宽限期? 那里有什么? 在将NFS服务器迁移到另一个节点后,如何防止文件在客户机上过时而不重新启动? 实际上是否可以迁移NFS服务器而不需要大file upload?

如何在我的局域网中testing负载均衡?

我最近发布了一个有关在预算上负载均衡Web服务器的问题 。 现在是时候开始testing了,所以我想在我的局域网中运行pacemaker + corosync设置两个或多个Ubuntu虚拟机,以便学习基础知识并尝试不同的configuration。 安装两个corosync + pacemaker之后我该如何开始安装,因为我的局域网中没有连接到每个虚拟机上的公共IP?

高可用性/故障安全两个不同的位置

我想知道是否有人可以帮助安装,似乎并不困难。 我刚开始使用多服务器设置。 我很抱歉,如果我的问题是愚蠢的。 我有两个不同地点的debian服务器。 其目的是为apache / mysql / filesystem创build一个故障安全和高可用性系统。 这两个服务器应该(一个域名或一个IP如果可能的话)一起提供请求。 如果一个人(电源,硬件,networking)出现故障,另一个人应该接pipe所有的请求,当第一个人再次回来时,它应该同步并重新联机。 所以问题是:1)我一直在探索pacemaker / corosync的configuration,但没有find一个好的教程,使用它在不同的位置(所有howtos是针对同一个networking)。 这是一个正确的路要走吗? 我看到的一个问题是,添加额外的服务器并不简单,许多选项取决于服务器的数量。 另外,服务器有不同的ips,如何切换? 在内部networking,你只是发送正确的ARP消息,但在不同的networking? 2)对于文件系统,我select了使用gfs2的drbd(双引擎)。 这是一个很好的解决scheme,还是我应该找别的地方? 3)负载平衡并不重要,在这种情况下,解决“分裂脑”是容易得多,因为我明白了吗? 我应该放弃负载平衡,而使用主从? 4)我可以只使用mysql内部同步或将其放置在drbd-partion是至关重要的?

迁移资源时,NFS故障转移将失败并显示失效的文件句柄

在这里遇到一些问题,我设置了两台带有Glusterfs的服务器(Centos 6)和它们之间的共享目录,我将nfs目录移动到共享的Gluster文件夹,并在两个框上创build了一个符号链接。 机器可以通过主机名与自己对话,Gluster复制通过服务器之间的另一个以太网卡进行处理。 我遇到的问题是,即使资源故障转移正确(尽pipe似乎在故障转移时出现了几次),我在客户机上得到了过时的nfs句柄。 以下是我的crmconfiguration; 我究竟做错了什么? 客户端上的nfs挂载尽可能简单。 node GlusterFS01 node GlusterFS02 primitive ClusterIP ocf:heartbeat:IPaddr2 \ params ip="10.10.10.167" cidr_netmask="24" clusterip_hash="sourceip" \ op monitor interval="5s" primitive exportfs ocf:heartbeat:exportfs \ params fsid="0" directory="/GlusterFS/Files" \ options="rw,sync,no_subtree_check,no_root_squash" \ clientspec="10.10.10.0/24" \ wait_for_leasetime_on_stop="false" \ op monitor interval="5s" \ op start interval="0s" timeout="240s" \ op stop interval="0s" timeout="100s" \ meta is-managed="true" target-role="Started" primitive […]

是否可以防止pcs / dlm / crm在节点失败时屏蔽该节点?

是否可以防止pcs / dlm / crm在节点失败时屏蔽该节点? 我只使用集群来构buildGFS2存储,并有我自己的方式来避免裂脑。 所以我不需要诸如fence和dlm-locks之类的东西。 我尝试在CentOS7中通过以下方式configurationon-fail操作:使用pcs resource update dlm/clvmd/gfs2_res op monitor onfail=ignore并编辑文件/etc/corosync/dlm_cfg ,编辑on-fail="ignore"并重启所有节点。 重启后,我可以从pcs cluster cib检查,所有的“fence”都变成了“ignore” 但是当我杀死一个节点中的corosync时,另一个节点仍然试图去阻止它,就像从消息日志中看到的那样。 3月5日10:37:10 node0 stonith-ng [1733]:notice:remote_op_done:node3对node3的操作重启为[email protected]:没有这样的设备 3月5日10:37:10 node0 crmd [1739]:notice:tengine_stonith_notify:对于node3,Peer3没有被node3终止(重新启动):客户端stonith_admin没有这样的设备(ref = a7be5018-4894-4de2-9273-8867d034d7af)。 controld.24862 我只是想知道是否有办法完全避开围栏? 这只是给我的系统带来了很多麻烦。

SLES 12高可用性群集 – scsi持续预留防护

我正在试用SLES 12 w / HAE来运行由两个节点组成的文件服务器群集。 想法是使用SCSI持久预留作为使用stonith fence代理的fence_scsi脚本的防护方法。 两个节点(a,b)通过FC连接到同一个LUN,然后通过NFS从主动节点导出。 问题是与fence_scsi crm失败/抱怨nodename /键没有提供。 primitive storage-fence stonith:fence_scsi \ params action=off devices="/dev/mapper/mpath_test" \ op monitor interval=60s timeout=0s 我结束了: storage-fence_start_0 on fs009a 'unknown error' (1): call=18, status=Error, last-rc-change='Wed Jun 17 00:51:40 2015', queued=0ms, exec=1093ms storage-fence_start_0 on fs009b 'unknown error' (1): call=18, status=Error, last-rc-change='Wed Jun 17 00:56:42 2015', queued=0ms, exec=1101ms 和 […]