Articles of 故障转移

FreeBSD的负载分割和故障切换(2个WAN)(dynamic路由)

我有一个LAN接口和2个WAN接口(2条不同的ADSL线路)的freebsd服务器(ipfw,dhcp,dns)。 WAN接口(re0和re1)被聚合成一个lagg0故障转移(ifconfig_lagg0 =“laggproto failover laggport re0 laggport re1”)。 我想使用的是路由到某些networking的stream量re1,在re1链路断开时故障转移到re0,但仍默认使用re0和故障转移到re1。 可能吗? 谢谢。 [UPDATE] 好的,所以粘合不是一个可能的解决scheme(现在我看到它是显而易见的)。 当其中一条线路上的链路断开时,如何自动更新网关上的路由? 我不在乎是否需要从ipfw切换到pf(我正在计划交换机)。 再次感谢。

不通过Cisco PIX 515e

我们上周在数据中心停电,当运行IOS 7.0(8)(configuration了故障切换电缆)的双PIX 515E回来时,它们处于故障切换状态,其中辅助设备处于活动状态,主设备是待机我已经尝试了“故障切换重置”,“故障切换激活”和“故障切换重新加载备用”以及按照各种命令在两个单元上执行重新加载,并且它们不返回主/主备用/备用。 我没有尝试过的唯一一件事情就是开往数据中心并进行硬重启,这是我讨厌的事情。 我已经阅读了思科安全防火墙上的故障转移工作原理 ,看起来这应该是非常糟糕的。 在主show failover上输出show failover : Failover On Cable status: Normal Failover unit Primary Failover LAN Interface: N/A – Serial-based failover enabled Unit Poll frequency 15 seconds, holdtime 45 seconds Interface Poll frequency 15 seconds Interface Policy 1 Monitored Interfaces 2 of 250 maximum Version: Ours 7.0(8), Mate 7.0(8) Last Failover […]

具有故障转移支持的IRC服务?

我运行一个服务器(称为服务器A) IRC的networking,感谢一些朋友的慷慨解囊,我得到了第二个服务器(服务器B) ,我可以运行一个IRCd以便在服务器A崩溃的情况下提供冗余。 这很好,我可以build立与服务器链接的循环DNS。 我遇到的问题是如何处理服务? 有谁知道在服务器故障的情况下让服务“故障转移”的方法吗? 例如,服务器A开始运行服务,但突然崩溃。 服务器B检测到这一点,并启动自己的服务副本(最好使用与服务器B上的服务相同的configuration和数据) 其中一个解决scheme就是写一个每个服务器都运行的僵尸工具,它定期检查来自其他服务器的僵尸程序是否在通道中。 如果是,那么一切都很好。 如果不是,那么故障转移。 我宁愿不必自己编码 我们目前在Linux上使用虚幻IRCd和Anope服务

Apache负载均衡器,故障切换和备份

我做了与Apache和mod_proxy负载平衡。 一切正常,我可以在两台服务器之间进行负载平衡。 现在我想做更多。 首先,我想做故障转移(如果一个服务器停机,所有的费用都转到另一个)>它只适用于这个:nofailover = On? 然后,我想要第二个负载平衡器作为备份,如果第一个下来。 我在互联网上search,但我没有find。 你知道是否有可能做到这一点? 要完成,是否可以更改负载平衡器中的configuration(如服务器的IP),而不必重新启动它,因为它正在运行? 感谢您的回答

使用Nagios监视ISC DHCP故障切换状态

我最近实现ISC DHCP故障转移,它的工作很好,但我想监视使用Nagios故障转移的当前状态。 最终,我想我的Nagios检查: 当辅助DHCP服务器启动时报告警告 (由于主服务器的问题而开始服务地址) 当小学和中学不活跃时报告一个关键 。 不幸的是,监视dhcpd进程是否正在运行是不正确的解决scheme – 即使在dhcpd仍在运行时,故障切换状态也可以激活。 从我研究的内容看来, dhcpd无法查询当前状态。 除了parsing日志文件,没有人知道干净的方式来确定dhcpd服务器当前是否处于故障转移状态?

error_page似乎不适用于nginx上游指令

我正尝试使用nginx来负载平衡一些下游应用程序服务器,并且如果所有下游服务器都处于脱机或无响应状态,则显示“失败鲸鱼”样式页面。 不幸的是,nginx的文档说,你不能在upstream模块中使用backup指令和ip_hash指令,所以我一直在想办法替代。 现在,我的configuration中的相关块是: upstream appservers { ip_hash; server srv1:8080; server srv2:8080; } server { listen 80; location / { proxy_pass http://appservers; proxy_set_header X-Scheme $scheme; proxy_connect_timeout 5s; error_page 502 503 504 http://failwhale.myapp.com; } } 问题是,如果我closures了两个应用程序服务器,当nginx返回一个502(错误的网关)错误,它似乎使用默认的502错误页面(纯白色的ish)而不是redirect到http:// failwhale。 myapp.com (这也是由nginx服务,绝对是)。 有没有人知道我做错了什么,或者如果这应该是我希望的工作? 如果没有,还有什么可以做的?

Exchange 2010 DAG

你可能刚刚在这里看到我的另一个问题。 客户没有告诉我的其中一件事情是,他们还想在美国和欧洲的一个地点之间build立一个DAG。 我从来没有成立过一个DAG,但是我做到了,并且和微软合作,确保我做对了。 这似乎很好,一切都复制。 问题是,当我试图testing它失败时,它不会。 我发现这里的信息导致我相信他们可能还需要一个硬件networking负载平衡器,但是我不完全了解它是如何工作的,以及它如何使Exchange知道它已经失败了。 任何人都可以向我解释吗? 我看了。 谢谢。

数据中心死亡时的DNS故障转移

我只是想configuration我的DNS服务器切换DNS服务器(绑定)中的DNS条目,如果服务器变得不可达。 有一个简单的工具,我可以用它来做到这一点?

Akamai网站故障切换触发器

我的组织目前拥有2个数据中心,从中可以托pipe公司网站,Akamai提供负载平衡和其他CDN服务。 现在,我被告知,如果我们在1个数据中心的服务器堆栈停止响应,Akamai将自动将传入stream量路由到备用数据中心。 问:现在我的问题是,导致Akamai启动此路由的触发器是什么? 即。 Apache Http服务器是否必须停止在端口80上侦听/响应,否则将返回非2XX / 3XX / 4XX代码呢? (即让应用程序服务器返回HTTP 500的) 如果是这样的话,是否可以将其configuration为以上下文为基础进行工作,这样,如果http://www.example.com/search发生故障(应用程序服务器返回HTTP 500),到/ search的stream量将被路由到其他位置,但所有其他stream量仍然击中两个堆栈? 问:还有,服务恢复后多长时间才会开始stream量回传?

Bond0故障转移,当链接灯保持:高可用性networking

组态: 两个交换机,每个都有独立的互联网路由 具有eth0和eth1的Centos服务器在bond0上作为主动备份绑定,在switch上为eth0,在另一个上为eth1 /etc/modprobe.confconfiguration如此,对于bond0: alias bond0 bonding options bond0 mode=1 primary=eth0 miimon=100 eth0有时插入主交换机,有时是辅助交换机。 场景: 二级交换机有内存故障 链路灯保持不变,但交换机不再处理stream量 所以,因为我们使用miimon,只是获取链接状态,所以当交换机出现故障时,我们的服务器都没有禁用链接。 这导致networking中断,并且在eth0在那个辅助交换机的服务器上,他们变得完全不可用。 具有讽刺意味的是,这种情况比刚刚经历过这种情况的人要糟糕,因为他们没有进行故障切换。 我一直在testingarp_interval作为替代,但据我了解,arp_interval有两个限制: arp_ip_target只占用一个IP地址,这意味着如果该IP地址closures,bond0将错误地认为该链路应该closures,并把它closures。 我使用网关作为IP地址,但是如果网关出现故障,仍然可以继续进行内部到交换机的通信。 arp_ip_target也不会这样做; 它只会closures所有接口,甚至到最后。 arp_interval取决于一些networkingstream量(?),一个非常安静的链接可能会被错误地closures。 有没有办法绕过这些arp_interval限制? miimon能configuration好吗? 有没有更好的方法来完成HA联网? 我们一直在考虑通过每个服务器上的守护进程来手动处理故障转移,而不是使用arp_interval(即监视链接本身,并使用ifenslave将它们上下)。 我们已经不是表演的中介了, 可靠性真的是我们的首要任务。