Articles of 高可用性

corosync和多个负载平衡器

我正在尝试使用pacemaker / corosync为我们的负载平衡器(可选nginx,pgpool和haproxy)提供高可用性function。 我定义了三个基本原理: 1为故障转移IP, 1为lsb :: nginx 1代表lsb :: pgpool 我假设我可以添加lsb :: haproxy,虽然我还没有testing过这个场景。 并将它们分组在一起。 我的问题是,例如,当pgpool发生故障时,集群将切换到另一个节点,包括nginx。 根据我对文档的理解,故障转移IP只能包含在一个组中,使其成为一个全部或全部的情况(无论是所有的服务工作还是失败的情况下,都会发生故障切换)。 是否可以将它们组合在一起,例如node1可以使用相同的虚拟IP提供nginx和node2 pgpool和haproxy? 这甚至有可能吗? 我使用的Debian Wheezy来自它的仓库的所有软件包(haproxy来自backports)。 感谢您的回复。

任何可以执行SMTP故障转移的软件/代理?

我正在使用监控软件发送电子邮件到我的ISP的邮件服务器(SMTP服务器)。 但有时,ISP的邮件服务器停机,或者需要很长时间才能响应,我想知道是否有Windows软件/代理可以将电子邮件转发到其他邮件服务器,例如Gmail,Yahoo邮件等。

使用另一个界面监控ucarp VIP

在Debian机器上,我想在两个节点之间为公共IP设置一个VIP,但我想避免使用三个IP地址使两个节点之间的ucarp通信。 我可以设置它,以便ucarp将使用另一个物理接口进行通信,而不是持有VIP的那个?

在两个esxi 5.1上使用虚拟机进行Web服务器故障切换

我在两个网站abc.com,cde.com和我的模型的数据中心有两台服务器: ESXi 1 来自ISP的NIC1 113.11.11.11 NIC2 192.168.1.1交叉连接NIC2 ESXi2 VM CentOS6 iptables1 HA proxy1在ESXi2上与HA proxy2进行故障切换 在ESXi2上使用apache2虚拟机CentOS6 apache1 rsync VM CentOS6 mysql1在ESXi2上与mysql2复制 ESXi 2 来自ISP的NIC1 113.11.11.12 NIC2 192.168.1.2交叉连接NIC2 ESXi1 VM CentOS6 iptables2 HA proxy2故障切换 VM CentOS6 apache2 VM CentOS6 mysql2 当ESXi1因客户端无法连接到网站,因为abc.com,cde.com指向ESXi1的IP 113.11.11.11。 当其中一个客户端仍然连接网站。 怎么做? 请告诉我! 非常感谢

具有专用SSL HA的多域服务器

我正在托pipe一个具有150个域名(网站)的服务器,每个ssl的requere专用IP地址。 所以服务器的Windows 2008,有150个IP地址和150个网站。 我需要有高可用性解决scheme。 所以想build立AWS,但ELB不会是一个解决scheme…和最大的IP我可以得到每个实例是12个地址。 那么我能做些什么来让所有150个站点托pipe在一个实例上,并且是HA在不同的可用区域中的实例。

IBM V7000固件升级对安装的LUN有影响

我们已经将IBM Storwize V7000 Storage(固件将升级到最新版本)。这将需要重新启动存储。 我从这个存储中获得了10个LUN(几乎10TB),并安装在Red Hat Linux 6.4服务器上。 服务器是运行DM多path的HA-LVM群集的一部分,是主节点。 我已经在服务器上连接了QLogic QLE2560 HBA卡。 我的问题是,当存储进行重新引导时,这些LUN的影响是什么。 我应该把它们全部装好,因为它是一个HA-LVM集群我只能停止使用LUN的集群服务 由于我还没有这样做,我想要做好准备,在重启sotrage之前我可以采取一些预防措施,一旦存储上线,我可以重新挂载它们。 谢谢

起搏器为nginxconfiguration资源

我试图build立两个虚拟机使用virtualbox集群我按照这个教程http://www.tokiwinter.com/clustering-with-drbd-corosync-and-pacemaker/ 并input如下命令 [root@node1 data]# crm configure primitive nginx_res ocf:heartbeat:nginx params configfile=/etc/nginx/nginx.conf httpd=/usr/sbin/nginx op monitor interval=60s timout=10s op start timeout=40s op stop timeout=60s error: unpack_resources: Resource start-up disabled since no STONITH resources have been defined error: unpack_resources: Either configure some or disable STONITH with the stonith-enabled option error: unpack_resources: NOTE: Clusters with shared data need STONITH […]

监测起搏器与url触发外部代理

我有一个HA设置,现在唯一configuration的资源是主动/被动configuration的心跳。 在云中运行Debian 7,64位。 现在我想在资源发生变化时触发一个来自Pacemaker的信息。 URL指向某个将发送电子邮件/ SMSalert的服务器。让URL触发为http://example.com/pacemaker.php?CRM_notify_node=node1&CRM_notify_rsc=blah 由于configurationPacemaker的所有东西是乏味的。 所以所有的处理或发送电子邮件/警报被放入网页。 那么,如何configurationPacemaker来调用URL。 谢谢

Docker Swarm和Consul生产设置build议

我想build立一个生产HA Docker Swarm集群。 在这种情况下,Docker Swarm需要一个Key Value商店作为先决条件。 现在我问一个聪明的设置是什么: Consul应该在Docker容器中运行 领事必须是HA并且可以自动扩展 Consul容器应该用Docker Swarm来pipe理(这需要领队运行) 约束 在主机上运行领事不是一个select 不得不手动pipe理consul容器 具有Docker Hub令牌的Docker Swarm不是一个选项 途径 任何想法如何能够以清洁可靠的方式解决鸡或鸡蛋问题,从而实现高效运作? 多个群体实例肯定会看起来像一个合理的方法,但如何设置没有领队和群体的初始群体? 谢谢。

RabbitMQ集群每30分钟重新启动一次

我有一个双节点RabbitMQ 3.6.1群集(在AWS的CentOS 6.8上),似乎每隔30分钟重新启动一次。 我只是通过两台机器上的日志( /var/log/rabbitmq/rabbit@<hostname>.log )来获取所发生的事件的时间表。 我把它们重新安排在这个列表中: 19:22:10 UTC – 10.101.100.173: Stopping RabbitMQ – > Stopped RabbitMQ application 19:22:10 UTC – 10.101.101.48: Statistics database started 19:22:10 UTC – 10.101.100.173:RabbitMQ重新开始启动 19:22:10 UTC – 10.101.101.48:注意10.101.100.173 关机 ,然后loggingKeep [email protected] listeners: the node is already back 19:22:50 UTC – 10.101.100.173:RabbitMQ完成启动,logging消息开始“服务器启动完成,6个插件启动”。 19:22:50 UTC – 10.101.101.48:注意10.101.100.173已经启动 19:22:54 UTC – 10.101.101.48: Stopping […]