我有一个与心脏起搏器群集有关的问题。 我在Active / Backup HA中使用了两个防火墙。 检测信号IP在专用networking上为10.0.0.1 (FW 1)和10.0.0.2 (FW 2)。 局域网上的stream量IP为131.107.2.2 (FW 1), 131.107.2.3 (FW 2),虚拟IP为131.107.2.101 。 广域网上的stream量IP为192.168.100.98 (FW 1), 192.168.100.99 (FW 2),虚拟IP为192.168.100.101 。 如果FW 1断电,则FW 2将按照预期进行接pipe,但是如果LANnetworking上的网线断开,则不会发生切换。 以下组件正在集群中使用: 起搏器 corosync DRBD contrackd 任何帮助是极大的赞赏。
使用两个节点: node1:192.168.0.1 node2:192.168.0.2 在两台服务器上安装HA工具: yum install pacemaker pcs (它将包括安装corosync) 在两台服务器上: passwd hacluster 为集群设置相同的密码。 在两台服务器上: systemctl enable pcsd.service systemctl start pcsd.service validation群集节点: node1# pcs cluster auth 192.168.0.1 192.168.0.2 他们都成功通过authentication。 生成corosyncconfiguration: node1# pcs cluster setup –name mycluster 192.168.0.1 192.168.0.2 启动群集: node1# pcs cluster start –all 成功。 确认状态: pcs status corosync Output Membership information ———————- Nodeid Votes Name […]
我正在尝试使用OVH服务器作为群集。 我在CentOS 7上安装了pacemaker-1.1.10,corosync-2.3.3和pcs工具。 现在我想使用https://github.com/ClusterLabs/fence-agents/blob/master/fence/agents/ovh/fence_ovh.py 我怎样才能build立和从https://github.com/ClusterLabs/fence-agents安装 当我运行这个 $ git clone https://github.com/ClusterLabs/fence-agents $ cd fence-agents $ ./autogen.sh && ./configure && make && sudo make install 它停在./configure autoreconf: Entering directory `.' autoreconf: configure.ac: not using Gettext autoreconf: running: aclocal -I make -I m4 configure.ac:70: warning: AC_LANG_CONFTEST: no AC_LANG_SOURCE call detected in b ody ../../lib/autoconf/lang.m4:193: AC_LANG_CONFTEST is expanded from… […]
我在两台Centos服务器上configuration了Corosync和Pacemaker,一切工作正常。 问题是当我问题 pcs status 它报告: Online: [ Node1.localomain ] OFFLINE: [ Node2.localdomain ] Full list of resources: VIP (ocf::heartbeat:IPaddr2): Started Node1.localomain haproxyLB (ocf::heartbeat:haproxy): Started Node2.localomain 这在现实中恰恰相反! Node1.localomain是node1的主机名,Node2.localomain是节点2的主机名。 事实上,Node2.localomain采取了VIP和正在服务的请求,但正如你所看到的PC报告,VIP是在Node1.localdomain和Node2.localdomain处于脱机状态启动! 你们有什么想法吗?
如果使用cman / corosync运行3个或更多节点群集,并且某种共享块存储(SAN)仅连接到群集中的某些节点,那么如何在该存储设备上启用CLVM? 在我的示例中,我正在运行3节点群集,其中2个节点是“主要工作负载”,1个节点用于备份和归档。 主节点通过多path与FC HBA连接。 一切工作正常,我能够初始化该设备上的PV,并可以在两个节点上看到它: PV VG Fmt Attr PSize PFree /dev/mapper/mpathd san-vg1 lvm2 a– 500.00g 500.00g 现在,为了创build一个集群VG,我已经在集群中的所有3个节点上启用了防护(如果有的话,使用IPMI)。 fence domain member count 3 victim count 0 victim now 0 master nodeid 1 wait state none members 1 2 3 我也创build了一个聚集的VG( vgcreate -c )在那个PV上,也可以正常工作: VG #PV #LV #SN Attr VSize VFree san-vg1 1 0 […]
祝大家好日子 我有三台服务器。 试图获得一个群集。 只需在node1上写入cli(master) pvecm create prox-test和pvecm add "ip of the master node"在node2上pvecm add "ip of the master node" 。 但群集不起作用,只是在networking上“没有法定人数”的消息。 而这在主节点syslog中: Sep 21 10:50:01 pve dlm_controld[3181]: daemon cpg_join error retrying Sep 21 10:50:01 pve fenced[3164]: daemon cpg_join error retrying Sep 21 10:50:02 pve pmxcfs[2950]: [dcdb] notice: cpg_join retry 21250 Sep 21 10:50:03 pve pmxcfs[2950]: […]
这可能有一个简单的解释,但我当然想不起来。 我已经安装了corosync(通过yum),它是默认的init脚本。 在这个特殊的CentOS安装中有些奇怪,因为我经常需要手动链接/etc/rc.d/init.d/到/etc/init.d。 问题是通过它的符号链接运行失败,但它通过/etc/rc.d/init.d运行良好 更奇怪的是,如果使用完整path运行,并且仅在实际运行在/etc/rc.d/init.d目录下,则运行失败。 例: [~]# /etc/rc.d/init.d/corosync start Starting Corosync Cluster Engine (corosync): [FAILED] [~]# service corosync status corosync is stopped [~]# cd /etc/rc.d/init.d/ [init.d]# /etc/rc.d/init.d/corosync start Starting Corosync Cluster Engine (corosync): [FAILED] [init.d]# corosync start [init.d]# service corosync status corosync (pid 1985) is running… 任何解释? 编辑: 不知道我改变了什么,但现在从/rc.d/init.d开始工作,但是没有启动service corosync。 [root@server2 mirror]# /etc/rc.d/init.d/corosync start Starting […]
我有以下资源: primitive WowzaMediaServer lsb:WowzaMediaServer \ op monitor interval="30s" timeout="60" \ op start interval="0" timeout="60" \ op stop interval="0" 我想了解什么是“监视间隔”和“超时”的意思。
我想configuration我的起搏器为jboss服务器。 我有2个节点与MySQL主/从configuration。 问题是我想在位于master数据库的节点上启动jboss。 一个可能的解决scheme是:在2个节点上启动jboss,但只在主节点所在的一个节点上部署应用程序。 我该如何解决这个问题? 我目前的configuration是: 节点氧\ 属性standby =“off”p_mysql_mysql_master_IP =“10.3.1.4” 节点氧气\ 属性standby =“off”p_mysql_mysql_master_IP =“10.3.1.5” 原语VIRT_IP ocf:心跳:IPaddr2 \ params ip =“192.168.1.250”nic =“eth1”\ meta target-role =“已启动” 原始的p_mysql ocf:percona:mysql \ params config =“/ etc / mysql / my.cnf”pid =“/ var / run / mysqld / mysqld.pid”socket =“/ var / run / mysqld / mysqld.sock”replication_user =“repl_user”replication_passwd =“ola5P1ZMU “max_slave_lag =”60“evict_outdated_slaves […]
我们打算使用drbd来同步两个服务器(不同的硬件),以便在主服务器死亡的情况下获得一种HA。 这些服务器实际上托pipe在同一个数据中心(德国Hetzner),并且正在运行openSUSE。 服务器的主要目的是托pipe按需印刷的东西,并呈现或生成pdf。 我们希望同步“/ var / www”文件夹以及此刻存储在默认文件夹中的数据库。 我的计划是将这些文件夹移到drbd同步分区,并通过“ln”将它们链接回原来的位置。 还是相反呢? 或通过复制同步数据库? 主要的问题是,我们在每台服务器上只有100mbit的上行链路,我不知道是否足以在drbd-mode C中同步服务器。 也许你们中的一些人有任何build议或经验,你想与我分享。 PS:我还没有服务器,我只是刨了一切,如果一切正常。 编辑:我现在正在运行drbd同步过程,将/ dev / drbd0同步到主节点上的/ srv / drbd。 我已经将(ln)包含我的网站的文件夹/ srv / drbd / vhosts链接回/ srv / www /,但在我的浏览器中始终得到错误404错误。 这只是一个chown问题? 目前我正在尝试通过crm来configurationcorosync / pacemaker,但是我无法获得所有的基元运行。 这是我的configuration,也许你可以找出为什么它不会启动。 ============ Last updated: Mon Aug 5 16:37:54 2013 Last change: Mon Aug 5 16:37:32 2013 by root via cibadmin […]