Articles of corosync

MS-SQL Server在Ubuntu启动期间因Pacemaker故障转移而崩溃

我在Ubuntu Server 16.04 LTS上安装了mssql-server和mssql-server-ha。 我在两个节点上使用drbd,起搏器和corosync试图控制两个节点之间的自动故障转移。 crm status显示2个错误: Failed Actions: * res_mssql_monitor_5000 on hostname2 'invalid parameter' (2): call=57, status=complete, exitreason='2017/11/09 12:33:01 Expected local server name to be res_mssql but it was hostname1', last-rc-change='Thu Nov 9 12:33:01 2017', queued=0ms, exec=5241ms * res_mssql_start_0 on hostname2 'unknown error' (1): call=6086, status=complete, exitreason='SQL Server crashed during startup.', last-rc-change='Thu Nov 9 […]

corosync可以支持单播心跳模式吗?

corosync可以支持单播心跳模式吗? 从serverfault中的另一个线程,一些人在corosync conf下面提出: totem { version: 2 secauth: off interface { member { memberaddr: 10.xxx.xxx.xxx } member { memberaddr: 10.xxx.xxx.xxx } ringnumber: 0 bindnetaddr: 10.xxx.xxx.xxx mcastport: 694 } transport: udpu } 这个conftypes是指单播模式吗? 谢谢, 埃姆雷

为什么起搏器在辅助节点而不是主节点上启动?

我有两个运行httpd服务的Linux节点。 当我尝试在主节点上添加httpd资源时,服务将在第二个节点上启动,而不是在主节点上启动。 我在这里错过了什么? 初始设置: node vpc-storage-primary \ attributes standby="off" node vpc-storage-secondary \ attributes standby="off" property $id="cib-bootstrap-options" \ dc-version="1.1.9-55.2-2db99f1" \ cluster-infrastructure="classic openais (with plugin)" \ expected-quorum-votes="2" \ stonith-enabled="false" \ no-quorum-policy="ignore" \ migration-threshold="2" \ last-lrm-refresh="1370680015" rsc_defaults $id="rsc-options" \ resource-stickiness="100" crm_mon : Last updated: Sat Jun 8 09:41:20 2013 Last change: Sat Jun 8 09:28:49 2013 via cibadmin […]

corosync和多个负载平衡器

我正在尝试使用pacemaker / corosync为我们的负载平衡器(可选nginx,pgpool和haproxy)提供高可用性function。 我定义了三个基本原理: 1为故障转移IP, 1为lsb :: nginx 1代表lsb :: pgpool 我假设我可以添加lsb :: haproxy,虽然我还没有testing过这个场景。 并将它们分组在一起。 我的问题是,例如,当pgpool发生故障时,集群将切换到另一个节点,包括nginx。 根据我对文档的理解,故障转移IP只能包含在一个组中,使其成为一个全部或全部的情况(无论是所有的服务工作还是失败的情况下,都会发生故障切换)。 是否可以将它们组合在一起,例如node1可以使用相同的虚拟IP提供nginx和node2 pgpool和haproxy? 这甚至有可能吗? 我使用的Debian Wheezy来自它的仓库的所有软件包(haproxy来自backports)。 感谢您的回复。

监测起搏器与url触发外部代理

我有一个HA设置,现在唯一configuration的资源是主动/被动configuration的心跳。 在云中运行Debian 7,64位。 现在我想在资源发生变化时触发一个来自Pacemaker的信息。 URL指向某个将发送电子邮件/ SMSalert的服务器。让URL触发为http://example.com/pacemaker.php?CRM_notify_node=node1&CRM_notify_rsc=blah 由于configurationPacemaker的所有东西是乏味的。 所以所有的处理或发送电子邮件/警报被放入网页。 那么,如何configurationPacemaker来调用URL。 谢谢

DRBD与起搏器失败

我是Pacemaker和DRBD的新手,但我必须将它们configuration在一起。 我创build了2个drbd资源:Drbdwww和DrbdMysql但是,当我使用drbd_mon我有以下错误: Stack: corosync Current DC: s-ha-web1 (version 1.1.15-e174ec8) – partition with quorum Last updated: Mon May 8 21:58:45 2017 Last change: Mon May 8 21:58:36 2017 by hacluster via crmd on s-ha-web1 2 nodes and 7 resources configured Online: [ s-ha-web1 s-ha-web2 ] Resource Group: haweb vip (ocf::heartbeat:IPaddr2): Started s-ha-web1 httpd (ocf::heartbeat:apache): Started s-ha-web1 […]

corosync pacemaker crm状态显示DC:无和离线

我是corosync和pacemaker的新手,尝试使用vm node1和node2构build集群。 这里是/etc/corosync/corosync.conf # Please read the corosync.conf.5 manual page compatibility: whitetank totem { version: 2 secauth: off interface { member { memberaddr: 192.168.1.101 } member { memberaddr: 192.168.1.102 } ringnumber: 0 bindnetaddr: 192.168.1.100 mcastport: 5405 ttl: 1 } transport: udpu } logging { fileline: off to_logfile: yes to_syslog: yes #logfile: /var/log/cluster/corosync.log debug: off timestamp: […]

OpenHPI是可选的(不是强制的)给Pacemaker

我注意到Debian Jessie 8.9上的apt-get install -t jessie-backports pacemaker也安装了openhpid软件包,但systemctl status openhpid.service随后报告openhpid.service没有运行,因为尚未在/etc/openhpi/openhpi.conf : openhpid[17913]: ERROR: (init.c, 76, OpenHPI is not configured. See openhpi.conf file.) systemd[1]: openhpid.service: main process exited, code=exited, status=8/n/a 假设OpenHPI对于Pacemaker(使用Corosync)的操作是可选的(不是强制性的)并且不需要openhpid的运行实例(并且引用的错误消息可以被忽略)是正确的吗? 我倾向于认为这是部分原因,因为我没有发现在任何Pacemaker教程中编辑openhpi.conf信息。

如何在我的局域网中testing负载均衡?

我最近发布了一个有关在预算上负载均衡Web服务器的问题 。 现在是时候开始testing了,所以我想在我的局域网中运行pacemaker + corosync设置两个或多个Ubuntu虚拟机,以便学习基础知识并尝试不同的configuration。 安装两个corosync + pacemaker之后我该如何开始安装,因为我的局域网中没有连接到每个虚拟机上的公共IP?

迁移资源时,NFS故障转移将失败并显示失效的文件句柄

在这里遇到一些问题,我设置了两台带有Glusterfs的服务器(Centos 6)和它们之间的共享目录,我将nfs目录移动到共享的Gluster文件夹,并在两个框上创build了一个符号链接。 机器可以通过主机名与自己对话,Gluster复制通过服务器之间的另一个以太网卡进行处理。 我遇到的问题是,即使资源故障转移正确(尽pipe似乎在故障转移时出现了几次),我在客户机上得到了过时的nfs句柄。 以下是我的crmconfiguration; 我究竟做错了什么? 客户端上的nfs挂载尽可能简单。 node GlusterFS01 node GlusterFS02 primitive ClusterIP ocf:heartbeat:IPaddr2 \ params ip="10.10.10.167" cidr_netmask="24" clusterip_hash="sourceip" \ op monitor interval="5s" primitive exportfs ocf:heartbeat:exportfs \ params fsid="0" directory="/GlusterFS/Files" \ options="rw,sync,no_subtree_check,no_root_squash" \ clientspec="10.10.10.0/24" \ wait_for_leasetime_on_stop="false" \ op monitor interval="5s" \ op start interval="0s" timeout="240s" \ op stop interval="0s" timeout="100s" \ meta is-managed="true" target-role="Started" primitive […]