我正在Linode上运行一个应用程序。 他们的networking不支持多播。 许多用于故障转移的工具(keepalived,spread / wackamole,hearbeat)要求多播工作(据我所知)。 我已经阅读了他们所有的文档,甚至在“单播”模式(如果他们有),它仍然通过组播发送。 我知道使用GRE隧道,我可以在路由器不知道的情况下有效地发送多播,这将使我能够使用这些工具之一(现在我想使用keepalived)。 我在设备“gretun”上设置了我的隧道,如下所示: 10.0.0.1是指向www1的隧道接口 10.0.0.2是指向www2的隧道接口 我可以从万维网nc 10.0.0.2 80从WWW 1,80和nc 10.0.0.1 80从WWW 2,所以它似乎工作。 假装我试图分享的公共IP是69.164.69.69。 我有两个问题: configuration好keepalived监控隧道(gretun)后,两台机器仍然看不到对方。 这是我的configuration: global_defs { notification_email { [email protected] } notification_email_from [email protected] smtp_server localhost smtp_connect_timeout 30 router_id www1.app.com } vrrp_script chk_haproxy { script "killall -0 haproxy" interval 2 weight 2 } vrrp_instance VI_1 { state MASTER interface gretun […]
本着冗余和故障切换的精神,我想知道为DR设置AWS Elastic Load Balancer的一些策略,也就是说,如果这确实是一个问题? (一个ELB将LBstream量到1个*地区。) 我在问,因为在一个提议的云架构中,单点故障可能只有一个ELB。 谢谢。
假设一个系统中只有一个交换机,它连接到一堆机器上形成一个networking。 如果此开关closures,则整个networkingclosures。 发生这种情况的可能性不大。 我想知道…有什么方法来增加这些机器的可用性? 我需要有第二个交换机连接到每台机器(所以每台机器需要2个networking适配器)? 或者我可以以某种方式获得能够故障切换到另一台备份交换机的交换机? 还有其他build议的方法来做到这一点? 感谢您的指导。
我需要一个服务器/交换机/一些东西(我将其称为“故障切换”)来执行以下任务。 故障切换开关后面有两个HTTP服务器。 通常,所有的请求都被路由到server 1 。 如果服务器1死亡(及时对HTTP请求停止响应),则所有请求均被路由到server 2 。 当server 1恢复时(开始及时响应HTTP请求),所有的请求都被路由回server 1 。 故障切换开关有一个外部IP地址(请求最初到达)。 这件事应该尽可能的愚蠢和简单。 它是如何被恰当地调用的,这将是怎样的一个例子? 更新: 理想情况下,这不应该有任何移动部分(如HDD或风扇)。 所以专用的硬件解决scheme将是首选。 更新2: 这件事应该是一个开关,而不是一个平衡器。 它应该根据HTTP服务器的可用性进行切换,而不是ARP或ICMP 。
我将使用HAProxy作为负载平衡器,以平衡3个应用程序服务器上的请求。 但是如果平衡器服务器(HAProxy)在某个时候失败了呢? 我想克隆第一个平衡器,所以如果主要平衡器失败了,另一个平衡器将取代它。 像HSRP一样。 可能吗? 如果是的话如何? 谢谢,
注意:这是我以前关于DNS故障转移问题的后续。 目标:让客户的networking浏览器select下一个可用的服务器,如果一个人立即closures。 我读过的地方是,多个Alogging(虽然不是最好的解决scheme)是基于HTTP /浏览器应用程序的唯一“即时故障转移”解决scheme。 这是场景/例子: 我有两个服务器A和B,其中包含完全相同的内容。 服务器A的IP地址是1.1.1.1和1.1.1.2服务器B的IP地址是2.2.2.1和2.2.2.2我有一个在Godaddy注册的域名。 如果我想利用DNS循环,哪种方法最好? 方法1:我是否像这样在Godaddy中设置我的名称服务器条目? ns1.serverA.com ns2.serverA.com ns1.serverB.com ns2.serverB.com 方法2:或者让Godaddy作为我的域名服务器,然后添加一条logging: A @ 1.1.1.1 A @ 1.1.1.2 A @ 2.2.2.1 A @ 2.2.2.2 我的问题是,DNS循环会使用这两种方法吗? 如果不是,那么实现这个目标的最好方法是什么?
在进行内存和代码升级后,我们有相当数量的asa 5520(主动/备用对)出现问题。 该问题performance为失去与故障转移接口上的另一半的连接,并且通常伴随着备用设备的重新加载。 既然内存和代码都被触及了,我们就把这两个都视为问题的根源。 在适当的情况下,代码正在被重新调整,但这并不总是可行的。 有没有办法在设备启动和运行的时候testing内存(比如memtest)? 5520的运行8.2(3)W / 2GB RAM。 05:05:36 %ASA-1-105005: (Secondary) Lost Failover communications with mate on interface outside 05:05:36 %ASA-1-105005: (Secondary) Lost Failover communications with mate on interface inside 05:05:36 %ASA-1-105008: (Secondary) Testing Interface outside 05:05:36 %ASA-1-105008: (Secondary) Testing Interface inside 05:05:37 %ASA-1-105009: (Secondary) Testing on interface inside Passed 05:05:38 %ASA-1-105009: (Secondary) […]
我们有几十个用于SQL Server 2008和2008 R2 Enterprise / Datacenter的Win2008和2008R2企业集群。 过去,我们在全球的另一台服务器上出现了许多随机故障转移和“networking分区”错误的问题。 这主要是在更新网卡驱动程序和卸载Forefront端点保护解决(不知道如何发挥了一切,但它帮助)。 快到六月份到十一月,我们从SCOM和事件日志中获得了不断的警报,这些群集(特别是两个群集)每周几次都出现“networking分区”错误,但实际上并没有发生故障 。 SQL Server仍在运行,Web前端没有发现服务中断。 这些错误似乎来源于“被动”节点,并通过networking进行复制(我们收到来自被动,然后活动,然后是Web前端的第一个警报),但是所有节点/networking适配器/磁盘/应用程序/ IP /网站保持正常运行。 当群集,networking或任何东西没有出现问题时,我们无法find导致这些错误不断出现的原因。 任何有关我们可以去调查的原因或可能的方向的想法都会很好。
我有两台服务器configurationdrbd,corosync与起搏器。 这一切都工作正常,主服务器获得次要的,如果失败,并辅助获取主要。 但是,如果第一台服务器在故障转移后重新启动,drbd将不会再次连接,我必须做一个 drbdadm连接所有 在现在的中学。 这里是从我做的所有inputserver1的日志( https://www.refheap.com/95997 ): root@server1:~# ifdown eth4 Jan 12 08:11:37 server1 kernel: [237958.935578] ixgbe 0000:04:00.0: removed PHC on eth4 Jan 12 08:11:43 server1 kernel: [237965.430849] cib[2877]: segfault at 0 ip 00007f7d342c8aca sp 00007fffaba39e58 error 4 in libc-2.19.so[7f7d34247000+19f000] Jan 12 08:11:44 server1 kernel: [237966.427423] crmd[2878]: segfault at 0 ip 00007eff7d291aca sp 00007fffaae51538 […]
在我的Linux服务器中,我有三块网卡。 eth0卡连接到ISP1,eth1卡连接到LAN,eth3卡连接到ISP2。 我想要做的是自动使用eth3作为Internet连接,如果eth0连接失败。 如何才能做到这一点? 另一个问题是,我的防火墙是指eth0,因为服务器正在为客户端做NAT,如果使用eth3,这将被破坏,这怎么解决?