那么我正在设置一个正在运行的Linux-HA群集 *起搏器1.1.5 * OpenAIS的-1.1.4 *多path工具-0.4.9 * OpenSuSE 11.4,内核2.6.37 群集configuration通过LinBit的健康检查,所以我对此非常有信心。 多path正在使用,因为我们有一个LSI SASarrays通过2个HBA连接到每个主机(每个主机总共4条path)。 我现在想要做的是通过从多path设置中删除path来testing故障转移function。 多径path如下: pgsql-data (360080e50001b658a000006874e398abe) dm-0 LSI,INF-01-00 size=6.0T features='0' hwhandler='1 rdac' wp=rw |-+- policy='round-robin 0' prio=0 status=active | |- 4:0:0:1 sda 8:0 active undef running | `- 5:0:0:1 sde 8:64 active undef running `-+- policy='round-robin 0' prio=0 status=enabled |- 4:0:1:1 sdc 8:32 active undef running […]
我正在尝试让心跳在ec2上工作。 我遵循这个博客文章中的步骤。 SERVER1 autojoin none ucast eth0 175.41.181.175 warntime 5 deadtime 15 initdead 60 keepalive 2 crm respawn node ip-10-130-83-33 node ip-10-130-71-107 SERVER 2 autojoin none ucast eth0 175.41.182.186 warntime 5 deadtime 15 initdead 60 keepalive 2 crm respawn node ip-10-130-83-33 node ip-10-130-71-107 当我在两台机器上启动服务时,我会看到下面的内容。 我使用uname -nvalidation了主机名是正确的。 我有相同的身份validation密钥。 我试了私人和公共ipaddress。 两台ec2机器都在同一个区域。 Attempting connection to the cluster…….. ============ […]
如果应用程序有内部问题,Apache Web服务器正在与tomcat交谈并将其置于错误状态(如果他不可访问(“心跳”)),并且将其置于错误状态。 像数据库这样的问题,不能被访问等 tomcat如何认识到这一点? tomcat的内部检查看起来像/工作和他在做什么,以确定部署的应用程序是否正常或不正常,并将其传递给Apache Web服务器,使他的负载? TIA
我想知道是否有人可以帮助我,我试图设置心跳红帽5故障转移IP地址时,SSH服务器停止响应。 所以基本上你ssh到VIP,然后通过哪个服务器有浮动IP通过。 192.168.0.100 | | /————————\ | /————————\ | Server 01 | | | Server 02 | | eth0 – 192.168.0.1 |—–/ | eth0 – 192.168.0.2 | | eth0:0 – 192.168.0.100 | | eth0:0 – down | \————————/ \————————/ 如果ssh停止响应,我希望在第二台机器上启用eth0:0以允许ssh连接继续提供服务。 我试图按照我在网上find的一些文件,所以这里是我目前的configuration: ha.cf bcast eth0 keepalive 2 warntime 10 deadtime 30 initdead 120 udpport 694 auto_failback […]
我正在尝试构build一个dynamic的机器集群,这些机器必须与主节点通信(用于报告,更新和主节点要处理的各种其他任务)。 为了方便起见,我想到了使用heartbeat项目http://linux-ha.org/wiki/Heartbeat 。 Hearbeat提供了一个很好的故障转移和恢复机制,我想利用它。 我不打算使用ldirectord或任何虚拟IP。 我真的想使用心跳的主节点指定。 目前我只是运行一个简单的2节点设置,node1和node2的IP地址,我不控制(通过DHCP归属)。 由于节点可以dynamic添加到集群中,所以我这样configuration了ha.cf keepalive 2 warntime 6 deadtime 12 logfacility local0 bcast eth0 # Linux mcast eth0 225.0.0.1 694 1 0 auto_failback on node virtual node node1 node node2 respawn hacluster /usr/lib/heartbeat/ipfail apiauth ipfail gid=haclient uid=hacluster 像这样的haresources virtual \ nginx 因此,我设置了群集,以便virtual节点成为群集的首选资源。 这个节点不存在。 所以我希望所有的备用节点都要通过选举过程来决定谁在接pipe它时(=总是)。 我继续这样做,因为我想dynamic地添加和删除节点到configuration,但我仍然需要有一个首选节点 当我启动一个节点时它工作得很好,因为它只是拾取资源。 然而,当我启动第二个节点,具有完全相同的configuration(scp的configuration,所以没有差异的风险),两个节点释放他们的资源(我可以testing,因为没有任何节点触发它的nginx和以前的主,比如node1,closures它)。 如果需要的话,我可以发布完整的日志,但实际上发生了什么是节点只是试图从彼此获得资源,最终都释放他们的资源很多 ERROR: Both machines […]
我需要知道哪个机器是活动(1) – 被动(n)群集中的当前活动节点。 阅读我可以拿出的文档 cl_status rscstatus <node name> 它会返回不精确的各种值(全部,过渡,外部,无,本地)。 有什么确定的方法知道哪一个是主节点?
我使用2台机器与centos,mysql,drbd,心跳,星号。 节点1有 hdc:三星HD160JJ / P,ATA磁盘驱动器 内核版本1 SMP星期二8月21日17:50:26 EDT 2012 内核版本2.6.18-308.13.1.el5PAE mysql版本14.14 Distrib 5.1.65,用于pc-linux-gnu(i686)使用readline 5.1 DRBD版本版本:8.2.6(api:88 / proto:86-88) 心跳版本2.1.3 用于drbd分区的hdc4 节点2 SCSI设备sda:625140335 512字节hdwr扇区(320072 MB) 内核版本1 SMP星期二8月21日17:50:26 EDT 2012 内核版本2.6.18-308.13.1.el5PAE mysql版本14.14 Distrib 5.1.65,用于pc-linux-gnu(i686)使用readline 5.1 DRBD版本版本:8.2.6(api:88 / proto:86-88) 心跳版本2.1.3 sda6 for drbd分区 根据理想情况,如果节点1 ==主节点失败,则当前次要的节点==节点2立即成为主节点。 当节点1再次连接/然后它成为次要的&当节点2失败,然后节点1成为主…在… 当我尝试刺激情况时出现问题:1.节点1 ==主节点,所有必需的服务状态正常。 节点2 ==辅助节点,所有需要的服务状态正常。 从节点1中取出局域网电缆。结果: – 几秒钟后,节点2从第二级变为第一级,然后变为第二级。 所以mysql,星号服务,其中驻留drbd分区共享不起作用。 2.现在将电缆重新连接到节点1.结果: – 节点1成为辅助节点。 节点2也是次节点。 所以没有在哪里mysql和星号工作。 […]
我有以下设置: 两台运行双主节点的DRBD服务器与OCFS2 两个虚拟ips,每个服务器一个心跳 循环法DNS在两个vIP之间对NFS进行负载平衡 closuresServer1一段时间,导致Server2接pipevIP进行故障转移。 但是,当Server1返回时 – 即使DRBD正在运行同步(并因此不是最新的),一旦心跳再次获得连接,它将接pipe指定的vIP。 一旦Server1再次与Server2同步,我怎样才能configuration心跳来执行故障恢复? (而不是之前)
我正在vps.net上运行一个3节点的VPS,并且有一些奇怪的CPU /内存使用问题。 该框运行Hudson CI,HAProxy和Heartbeat的debian二进制文件。 在过去一周里,我得到了各种高负荷,导致VPSclosures。 当我第一次看到服务器的监控时,它声称Hudson是负责的,所以我把它关掉,让这个盒子运行一天左右,直到它再次失败。 这一次监测声称心跳是责任。 有什么build议么?
我设法build立了一个带有虚拟IP地址和ldirectord虚拟实例的心脏起搏器心跳集群,通过收集这里和这里的信息 。 看来使用ldirectord的正确方法是在两个apache服务器前面有两个负载平衡服务器,然后做一些arp技巧来让apache服务器响应虚拟IP。 根据这篇博客文章 (从“传统方式”开始),这些arp技巧将不能在双服务器设置上工作,并可能导致无限循环。 然后他提出了一些我并不完全了解的解决scheme,但保持专用。 所以我的问题是:是否有可能使用群集ldirectord负载平衡在两个服务器上的Apache实例? 像这张照片 ?