心跳服务器 Gind.cn

Linux-HA + dm-multipath：删除path导致段错误，内核空指针取消引用和STONITH

那么我正在设置一个正在运行的Linux-HA群集 *起搏器1.1.5 * OpenAIS的-1.1.4 *多path工具-0.4.9 * OpenSuSE 11.4，内核2.6.37 群集configuration通过LinBit的健康检查，所以我对此非常有信心。多path正在使用，因为我们有一个LSI SASarrays通过2个HBA连接到每个主机（每个主机总共4条path）。我现在想要做的是通过从多path设置中删除path来testing故障转移function。多径path如下： pgsql-data (360080e50001b658a000006874e398abe) dm-0 LSI,INF-01-00 size=6.0T features='0' hwhandler='1 rdac' wp=rw |-+- policy='round-robin 0' prio=0 status=active | |- 4:0:0:1 sda 8:0 active undef running | `- 5:0:0:1 sde 8:64 active undef running `-+- policy='round-robin 0' prio=0 status=enabled |- 4:0:1:1 sdc 8:32 active undef running […]

试图让心跳工作在ec2上的Ubuntu 64

我正在尝试让心跳在ec2上工作。我遵循这个博客文章中的步骤。 SERVER1 autojoin none ucast eth0 175.41.181.175 warntime 5 deadtime 15 initdead 60 keepalive 2 crm respawn node ip-10-130-83-33 node ip-10-130-71-107 SERVER 2 autojoin none ucast eth0 175.41.182.186 warntime 5 deadtime 15 initdead 60 keepalive 2 crm respawn node ip-10-130-83-33 node ip-10-130-71-107 当我在两台机器上启动服务时，我会看到下面的内容。我使用uname -nvalidation了主机名是正确的。我有相同的身份validation密钥。我试了私人和公共ipaddress。两台ec2机器都在同一个区域。 Attempting connection to the cluster…….. ============ […]

Tomcat如何知道，如果应用程序是OK或NOK？

如果应用程序有内部问题，Apache Web服务器正在与tomcat交谈并将其置于错误状态（如果他不可访问（“心跳”）），并且将其置于错误状态。像数据库这样的问题，不能被访问等 tomcat如何认识到这一点？ tomcat的内部检查看起来像/工作和他在做什么，以确定部署的应用程序是否正常或不正常，并将其传递给Apache Web服务器，使他的负载？ TIA

在SSH失败时，如何为IP设置心跳

我想知道是否有人可以帮助我，我试图设置心跳红帽5故障转移IP地址时，SSH服务器停止响应。所以基本上你ssh到VIP，然后通过哪个服务器有浮动IP通过。 192.168.0.100 | | /————————\ | /————————\ | Server 01 | | | Server 02 | | eth0 – 192.168.0.1 |—–/ | eth0 – 192.168.0.2 | | eth0:0 – 192.168.0.100 | | eth0:0 – down | \————————/ \————————/ 如果ssh停止响应，我希望在第二台机器上启用eth0：0以允许ssh连接继续提供服务。我试图按照我在网上find的一些文件，所以这里是我目前的configuration： ha.cf bcast eth0 keepalive 2 warntime 10 deadtime 30 initdead 120 udpport 694 auto_failback […]

心跳不是要求资源

我正在尝试构build一个dynamic的机器集群，这些机器必须与主节点通信（用于报告，更新和主节点要处理的各种其他任务）。为了方便起见，我想到了使用heartbeat项目http://linux-ha.org/wiki/Heartbeat 。 Hearbeat提供了一个很好的故障转移和恢复机制，我想利用它。我不打算使用ldirectord或任何虚拟IP。我真的想使用心跳的主节点指定。目前我只是运行一个简单的2节点设置，node1和node2的IP地址，我不控制（通过DHCP归属）。由于节点可以dynamic添加到集群中，所以我这样configuration了ha.cf keepalive 2 warntime 6 deadtime 12 logfacility local0 bcast eth0 # Linux mcast eth0 225.0.0.1 694 1 0 auto_failback on node virtual node node1 node node2 respawn hacluster /usr/lib/heartbeat/ipfail apiauth ipfail gid=haclient uid=hacluster 像这样的haresources virtual \ nginx 因此，我设置了群集，以便virtual节点成为群集的首选资源。这个节点不存在。所以我希望所有的备用节点都要通过选举过程来决定谁在接pipe它时（=总是）。我继续这样做，因为我想dynamic地添加和删除节点到configuration，但我仍然需要有一个首选节点当我启动一个节点时它工作得很好，因为它只是拾取资源。然而，当我启动第二个节点，具有完全相同的configuration（scp的configuration，所以没有差异的风险），两个节点释放他们的资源（我可以testing，因为没有任何节点触发它的nginx和以前的主，比如node1，closures它）。如果需要的话，我可以发布完整的日志，但实际上发生了什么是节点只是试图从彼此获得资源，最终都释放他们的资源很多 ERROR: Both machines […]

如何检查哪个节点是心跳的主人？

我需要知道哪个机器是活动（1） – 被动（n）群集中的当前活动节点。阅读我可以拿出的文档 cl_status rscstatus <node name> 它会返回不精确的各种值（全部，过渡，外部，无，本地）。有什么确定的方法知道哪一个是主节点？

DRBD心跳的资源angular色麻烦在Centos 5.4中由mysql文件所有者改变？

我使用2台机器与centos，mysql，drbd，心跳，星号。节点1有 hdc：三星HD160JJ / P，ATA磁盘驱动器内核版本1 SMP星期二8月21日17:50:26 EDT 2012 内核版本2.6.18-308.13.1.el5PAE mysql版本14.14 Distrib 5.1.65，用于pc-linux-gnu（i686）使用readline 5.1 DRBD版本版本：8.2.6（api：88 / proto：86-88）心跳版本2.1.3 用于drbd分区的hdc4 节点2 SCSI设备sda：625140335 512字节hdwr扇区（320072 MB）内核版本1 SMP星期二8月21日17:50:26 EDT 2012 内核版本2.6.18-308.13.1.el5PAE mysql版本14.14 Distrib 5.1.65，用于pc-linux-gnu（i686）使用readline 5.1 DRBD版本版本：8.2.6（api：88 / proto：86-88）心跳版本2.1.3 sda6 for drbd分区根据理想情况，如果节点1 ==主节点失败，则当前次要的节点==节点2立即成为主节点。当节点1再次连接/然后它成为次要的＆当节点2失败，然后节点1成为主…在… 当我尝试刺激情况时出现问题：1.节点1 ==主节点，所有必需的服务状态正常。节点2 ==辅助节点，所有需要的服务状态正常。从节点1中取出局域网电缆。结果： – 几秒钟后，节点2从第二级变为第一级，然后变为第二级。所以mysql，星号服务，其中驻留drbd分区共享不起作用。 2.现在将电缆重新连接到节点1.结果： – 节点1成为辅助节点。节点2也是次节点。所以没有在哪里mysql和星号工作。 […]

DBRD双主心跳资源pipe理

我有以下设置：两台运行双主节点的DRBD服务器与OCFS2 两个虚拟ips，每个服务器一个心跳循环法DNS在两个vIP之间对NFS进行负载平衡 closuresServer1一段时间，导致Server2接pipevIP进行故障转移。但是，当Server1返回时 – 即使DRBD正在运行同步（并因此不是最新的），一旦心跳再次获得连接，它将接pipe指定的vIP。一旦Server1再次与Server2同步，我怎样才能configuration心跳来执行故障恢复？（而不是之前）

哈德森和心跳造成VPS疼痛:(

我正在vps.net上运行一个3节点的VPS，并且有一些奇怪的CPU /内存使用问题。该框运行Hudson CI，HAProxy和Heartbeat的debian二进制文件。在过去一周里，我得到了各种高负荷，导致VPSclosures。当我第一次看到服务器的监控时，它声称Hudson是负责的，所以我把它关掉，让这个盒子运行一天左右，直到它再次失败。这一次监测声称心跳是责任。有什么build议么？

我可以使用只有2个服务器的ldirectord做HA负载平衡吗？

我设法build立了一个带有虚拟IP地址和ldirectord虚拟实例的心脏起搏器心跳集群，通过收集这里和这里的信息。看来使用ldirectord的正确方法是在两个apache服务器前面有两个负载平衡服务器，然后做一些arp技巧来让apache服务器响应虚拟IP。根据这篇博客文章（从“传统方式”开始），这些arp技巧将不能在双服务器设置上工作，并可能导致无限循环。然后他提出了一些我并不完全了解的解决scheme，但保持专用。所以我的问题是：是否有可能使用群集ldirectord负载平衡在两个服务器上的Apache实例？像这张照片？

Intereting Posts

bcache，mdadm RAID和LVM可能的层次结构是什么？ Apache VirtualHost Blockhole（在IP上的所有端口上进行所有请求）用webmin安装postgresql 9.1？如何在Windows 2008服务器上阻止外部networking访问 rsync的Ubuntu的Windows下cygwin – 方式来避免“无效的参数22”错误？苹果文件共享无法连接如何启用盐堆交换？ Apache2 + FCGI + PHP5不创build套接字/池使用Apache中的X-Forwarded-For头来限制访问 Git致命：无法写入new_index文件在Citrix服务器上为新用户自动configurationOutlookconfiguration文件如何复制用户权限与MySQL？在不同数据中心使用ELB和Web服务器的AWS Elasticache PHP会话 Linux上的高性能SSL终结者 Ganeti节点需要有相同的硬件？

Articles of 心跳