Articles of 故障转移

关于MAC和高可用性故障转移的新手问题

我正在阅读有关高可用性,我不明白以下我读:在故障转移的主要IP迁移到备份服务器,但必须MAC地址。 具体来说,我读了每台机器都有一个唯一的地址MAC,可以被机器中的所有接口使用。 我没有得到这个部分。 MAC是否属于NIC? 这句话中的接口是什么意思? 此外,在故障转移客户端必须更新其IP / MAC映射,并find3种方法,这是通过使用自定义的MAC并将其从公共IP一起移动到备份。 这怎么可能? 高可用性软件,例如Pacemaker做到这一点? 怎么样?

高可用性如何工作?

我不明白如何为我的简单场景设置故障转移。 我正在构buildAPI的服务网关。 我想要的是两台服务器 托pipe在不同的数据中心 。 而且我只是希望用户能够访问服务,即使其中一台服务器停机。 数据库同步没有问题,我只关心服务的可用性。 我该如何做,而防止用户在他们的最终实施任何types的故障转移逻辑? 我希望为用户提供单个域或单个IP地址,并能够使用此单一端点始终访问该服务。 我不明白的是如何做到这一点。 我知道我可以设置一个networking节点,将这些请求转发给第一台或第二台服务器,具体取决于这两台服务器当前正在联机。 但是,我没有看到这个设置如何解决了HA问题,因为我们刚刚为系统引入了单点故障 – 转发节点。 所以,如果这个节点出现故障,服务将不可用。 你能解释一下如何在现实世界中实现这一点吗? 是否有可能以合理的成本实现这一目标? (即不超过托pipe服务器本身的成本) 。 编辑:有人build议,不同的数据中心要求是昂贵的。 因此,请随时为1个数据中心内的2台服务器提供build议。 编辑2:随意提一下什么是该设置的合理成本。

通过HDD的SSD冗余

有没有一种方法可以保证使用硬盘的SSD冗余? Raid 1是保证硬盘冗余的最佳select,但SSD太昂贵,无法通过RAID保证冗余。 如果我要将SSD与HDD连接起来,我可以使用硬盘作为故障转移设备来保证冗余,并且懒散地镜像硬盘上的数据吗? (例如:每5分钟应该同步数据,而不是像Raid 1一样实时)。

消除networking服务器的单点故障?

我知道在DNS中,每个DNS服务器都会尝试看看他们是否会回应 我知道在电子邮件中,如果发生故障,它将进入列表中的下一个,或者它将持有一段时间的邮件 据我所知,在networking服务器,浏览器将得到一个networking服务器的IP地址,并尝试它,如果失败,它会放弃。 它是否正确? 如果是这样的话,那么将stream量从失败的IP地址引导出去的唯一方法是使用DNS服务器,甚至不会立即更新。

4服务器scheme的故障转移策略

我想弄清楚如何设置复制和故障切换在4个服务器(每个位置2个)任何服务器可能承担主angular色的情况下。 我最初的情况是以下一个: 位置A的2台服务器(One Master,One Slave); 位置B(2个从站)中的2台服务器。 为此,我正考虑使用在O'Reilly的“高性能MySQL”上提出的configurationMaster-Master Active-Passive,以便每个人都可以在需要时成为Master。 如果主人“死亡”,地点A的其他服务器将尽可能承担主angular色。 它总是比地点B上的服务器具有更高的优先级。如果地点A上没有服务器能够这样做,位置B上的服务器将只切换到主服务器。 由于MySQL无法自动处理,我需要一些其他的方式来实现这一点。 我已经读过心跳和Maatkit。 这是要走的路吗? 有没有人在类似的情况下使用这个? 有没有其他的方式去实现这一目标? 任何关于失败的指针将不胜感激。 我希望尽可能简单的避免像DRDB这样的东西。 我并不担心高可用性只是自动切换angular色的一种方法,没有太多的麻烦。 我正在使用SuSe Enterprise 10和MySQL 5.1.30社区。 提前致谢, 若昂

Tomcat mod_jk群集跳过404 http状态

我正在尝试使用mod_jk Tomcat Clustering几个月,到目前为止没有那么糟糕,但在部署期间面临一个问题。 我正在使用FarmDeployer将WAR复制并部署到集群中的其他节点,但大部分时间WAR未正确部署,从而使页面出现404错误。 即使在删除爆炸的战争目录并再次使用tomcat提取WAR之后,浏览器仍然无法渲染实际的站点,直到我重新启动/停止该特定节点上的tomcat服务(当然, http:// node-ip / myapp工作如果重新部署的战争,而不是http://site1.mydomain.net一次呈现404页)。 而且我认为这个问题是与浏览器相关的(尝试所有的浏览器),当在404错误之后重新部署时在其他计算机上呈现的页面。 我也尝试fail_on_status ,所以它把节点错误阶段,曾经呈现404 HTTP状态,并redirect到其他节点,但在我的testing,我发现它完全把这些节点错误状态,没有请求发送到这些节点,直到重新启动他们正在回来工作。 负载平衡器上的Workers.properties: workers.tomcat_home=/usr/share/tomcat workers.java_home=/usr/lib/jvm/java-6-openjdk ps=/ worker.list=cluster,balancer1,status worker.balancer1.port=8009 worker.balancer1.host=localhost worker.balancer1.type=ajp13 worker.balancer1.lbfactor=2 worker.balancer1.cache_timeout=20 worker.balancer1.socket_timeout=20 #worker.balancer1.fail_on_status=-404,-503 worker.web1.port=8009 worker.web1.host=192.168.1.8 worker.web1.type=ajp13 worker.web1.lbfactor=4 worker.web1.redirect=web2 worker.web1.cache_timeout=20 worker.web1.socket_timeout=20 #worker.web1.fail_on_status=-404,-503 worker.web2.port=8009 worker.web2.host=192.168.1.9 worker.web2.type=ajp13 worker.web2.lbfactor=4 worker.web2.redirect=web1 worker.web2.cache_timeout=20 worker.web2.socket_timeout=20 #worker.web2.fail_on_status=-404,503 worker.cluster.type=lb worker.cluster.balance_workers=web1,web2,balancer1 worker.cluster.sticky_session=True worker.cluster.sticky_session_force=False # Status worker for managing load balancer worker.status.type=status 任何人有任何想法跳过404错误节点,而不是打其他正确部署的节点? 至less在configuration中有任何提示,以便在面对启用了stickey […]

从目标环境获取网站列表时出错:指定了无效的dn语法

尝试将另一个(第二个)域控制器添加到现有的域。 在“Active Directory域服务configuration向导”的第二步中得到以下错误: 从目标环境获取网站列表时出错:指定了无效的dn语法。 由于上述错误,“网站名称”下拉列表为空。 这是截图 。 PS:主要的域控制器(当前的)和我试图添加的那个都在Windows Server 2012上运行.AC和域控制的操作级别也是Windows Server 2012。 哪里不对?

如何减lessHAProxy的故障转移时间?

我已经安装HAProxy,它工作正常。 我观察到,当其中一个节点发生故障时,HAProxy立即检测到,但将现有stream量切换/redirect到剩下的工作节点需要15-16秒 (我用不同的configuration检查了50次,但是这个切换时间是坚持15-16秒)。 任何人都可以帮我减less故障转移间隔? 我尝试了“内部”,“快速”,“下降”,“崛起”的configuration,但我不确定要做什么确切的事情。 这是我现有的configuration文件 , 更新:我能够减less这个15-20秒的时间5-6秒 ,但不能less于这个。 是否有可能进行实时故障切换? 我也在这里更新了我的最新haproxy.config global log 127.0.0.1 local0 debug maxconn 45000 # Total Max Connections. daemon nbproc 2 # Number of processing cores. stats timeout 1s defaults log global retries 1 option redispatch timeout server 100s timeout connect 100s timeout client 100s timeout queue 100s frontend localnodes bind […]

有传入stream量故障转移的开源解决scheme吗?

我们有两个互联网服务提供商,两个互联网服务提供商的互联网服务提供商IP地址相同 我想要传入stream量的故障转移,是否有任何开源解决scheme? 我可以做两个名字服务器,每个ISP一个吗? 我不确定,但根据我的知识,主要和辅助名称服务器将以循环方式回复,直到他们活着。 一旦任何名称服务器将无法访问,那么只有另一个将答复,所以如果我是正确的,那么我认为我可以通过在我的办公室做两个名称服务器传入故障转移…

故障转移/冗余SSH

我有一个SSH服务器,其中多个客户端SSH中维护一堆端口转发。 我想要做的是,如果服务器出现故障,让客户端自动连接到下一台服务器。 问题是,这将如何完成?