我想在故障转移系统中设置MSMQ。 我没有共享存储设置(硬件不可用 – 预算),但我有三个运行Windows Server 2016的dl380。 我想用法定服务器设置故障转移。 这是可能的设置?
我有几种情况需要在发生故障(服务器挂起或崩溃)时将应用程序从一台服务器迁移到另一台服务器。 在solaris上,我们使用VCS(Veritas Cluster Server)执行此操作。 什么选项可用于Linux? 请说明为每个设置/维护或成本(如果有的话)的努力水平。 – 更多细节添加 – 给出复杂程度的一个想法: 失败的服务器可能会挂起或崩溃,恕不另行通知,可能仍然是“可以ping通” 恢复服务器需要启动故障转移的应用程序 一旦服务器启动/关机失败,由于不与恢复服务器进行干预而变成被动服务器。 这是一个数据收集或计算节点,而不是数据库,所以更简单的解决scheme可以工作。 – 更多细节(对不起) – 共享存储不是一个选项,但是没有太多的状态(如果有的话)需要从一台服务器迁移到另一台服务器。 我们通过rsync保持两台服务器同步。 到目前为止,非常感谢你的所有post。
背景 我们发生了Windows故障转移群集中断的事件。 验尸表明该节点已被删除,如本文所述 。 我们最近才把这个集群完全迁移到VMware环境中,看起来上面描述的事件可能是导致停机的原因。 相关的VMware知识库文章谈到了增加Small Rx Buffers和Rx Ring #1设置,但警告说增加这些太多可能会大大增加主机上的内存开销。 在对150台Windows虚拟机的Network Interface\Packets Received Discarded性能计数器进行审计后,16个guest虚拟机上的22个vNIC丢弃了一些数据包。 一个足够小的数量,我不担心额外的内存使用的主机征税,但我想了解如何使用内存这些设置和内存来自。 问题 缓冲区的数量和环的大小之间的关系是什么? 如何计算用于这些设置的给定值的内存量? 由于这些设置位于客户操作系统中的NIC本身上,我假定它们是驱动程序设置。 这使我认为使用的RAM可能是分页或非分页池。 它是否正确? 如果是的话,我应该担心吗? 我在这里没有考虑到担忧吗? 我们正在尝试确定在受影响的VM上将这些设置设置为最大值是否存在缺陷,而不是VMware主机内存使用情况。 例如,如果我们增加客户内存池耗尽的风险,我们更倾向于从小做起。 这些问题中的一些(可能全部)可能不是特定于VMware或虚拟化的。
大多数浏览器如果从DNS服务器获取多个Alogging,其行为如何? 只要可以访问,就坚持一个IP(如果IPclosures,只能使用另一个IP)? 或者他们无时无刻都在切换? 如果大多数当前的浏览器都支持一个IP,那么DNS-RR就足够了,作为一个简单的故障转移解决scheme。
我拥有并运营visualwebsiteoptimizer.com /。 该应用程序提供了一个代码片段,我的客户在他们的网站中插入了一些特定的指标。 由于代码段是外部JavaScript(位于站点代码的顶部),因此在显示客户网站之前,访问者的浏览器会联系我们的应用服务器。 如果我们的应用程序服务器出现故障,浏览器会在超时(通常是60秒)之前继续尝试build立连接。 正如你所想象的,我们不能在任何情况下让我们的应用程序服务器停机,因为这不仅会影响我们的网站访问者的体验,也会影响我们客户的网站访问者的体验! 目前我们正在使用DNS故障转移机制,其中一台备份服务器位于不同的数据中心(实际上是不同的大陆)。 也就是说,我们从3个不同的位置监控我们的应用服务器,一旦检测到服务器closures,我们将Alogging更改为指向备份服务器IP。 这对大多数浏览器来说工作正常(因为我们的TTL是2分钟),但IEcaching了30分钟的DNS,这可能是一个交易杀手。 看到我们最近的一篇文章visualwebsiteoptimizer.com/split-testing-blog/maximum-theoretical-downtime-for-a-website-30-minutes/ 那么,如果应用程序数据中心遭受重大中断,我们可以使用什么样的设置来确保几乎即时的故障切换? 我在这里读www.tenereillo.com/GSLBPageOfShame.htm有多个Alogging是一个解决scheme,但我们不能承担会议同步(还)。 我们正在研究的另一个策略是有两个Alogging,一个指向应用程序服务器,另一个指向反向代理(位于不同的数据中心),如果启动则parsing为主应用程序服务器,如果启动则备份服务器。 你认为这个策略是否合理? 为了确定我们的优先事项,我们可以保留自己的网站或应用程序,但我们不能让客户的网站因为停机而放慢速度。 所以,如果我们的应用程序服务器closures,我们不打算回应默认的应用程序响应。 即使是一个空白的响应就足够了,我们只需要该浏览器完成该HTTP连接(没有别的)。 参考:我读这个线程这是有用的serverfault.com/questions/69870/multiple-data-centers-and-http-traffic-dns-round-robin-is-the-only-way-to-assure
当浏览器获得给定主机名称(例如ip1和ip2)的多个Alogging时,有人能够指导我获取有关确切浏览器行为的信息,并且其中一个不可访问。 我对EXACT的细节感兴趣,比如(但不限于): 浏览器会从操作系统获得2个IP,还是只有一个? 浏览器会先尝试哪个ip(随机或总是第一个)? 现在,让我们说浏览器开始与失败的ip1 浏览器要多久才会尝试ip1? 如果用户在等待ip1时点击“停止”,然后点击刷新 哪个IP会浏览器试试? 当它超时会发生什么 – 它会开始尝试ip2或给出错误? (如果错误,当用户点击刷新时,浏览器将使用哪个ip)。 当用户点击刷新,任何浏览器将尝试新的DNS查找? 现在让我们假设浏览器首先尝试使用ip2。 对于下一个页面的请求,浏览器还会使用ip2,还是可能随机切换ips? 浏览器将IP保存在caching中多长时间? 当浏览器发送一个新的DNS请求,并获得SAME ips,它会继续使用相同的已知的工作IP,或该过程从头开始,它可能会尝试任何两个? 当然,这一切都可能依赖于浏览器,也可能在版本和平台之间有所不同,我很乐意拥有最多的细节。 这样做的目的 – 我试图了解什么时候用户将遇到什么时使用循环DNS基于使用和主机之一失败。 请不要问DNS负载平衡有多糟糕,请不要回答“不要这样做”,“这是一个坏主意”,“你需要心跳/代理/ BGP /不pipe”等等。
我在configurationnginx时遇到了问题。 我使用nignx作为反向代理。 我想把我的所有请求发送到我的第一台服务器。 如果第一台服务器停机,我想发送请求到第二台服务器。 简而言之,如何在没有负载平衡的情况下拥有故障转移解决scheme?
我明白,要在HAProxy负载均衡设置上获得故障转移,您需要两台运行HAproxy的机器(并将其路由到多个Web服务器实例)。 但在这种情况下,说abcd.com,我们如何将这个stream量分割/路由到2个IP地址而不是一个? DNS通常将域名parsing为单个IP。 我们如何使用免费/便宜的工具/服务来做到这一点?
在pipe理自己的群集(即不使用/支付Amazon Autoscale,Rightscale,Scalr等)的人员中,您如何pipe理EC2上的实例并处理(例如)故障转移? 我想知道是否大多数人最终只是写了自己的EC2 API的脚本,正如我怀疑的那样。 这当然是我们的方法:掀起我们自己的基于Python的基于Boto的监控/重新启动后台程序,在异地运行,监听来自我们实例的UDP保持活动。 失败时,我们快照卷,注册图像,启动新实例,删除旧卷等等。 每当我们经常在对脚本进行黑客攻击的时候,我认为必须有一些开源的工具来处理这些问题,并且没有Scalr的限制,但是我总是从Google两手空空。 (像Scalr这样的软件在受支持的软件集/版本/configuration方面相当有限,并且具有专门和IMO笨重的操作这些设置的方法。) 另外,Linux-HA / Pacemaker生态系统(Heartbeat,ldirectord等)听起来并不适合EC2 。 (但后来我发现这一点 – 虽然我不确定这是否是一个高质量的解决scheme)。
我们有一个SaaS应用程序,我们需要高度可用。 我们已经有了一个维护良好的,维护良好的Hyper-V故障转移群集,但是今天我们托pipe这个群集的数据中心有五个小时的停电,导致我们完全脱机。 所以现在我们想知道更好的方法是在两个独立的数据中心使用服务器。 假设我们获得了这两个站点之间的所有后端文件复制和数据复制,我们想知道如何处理前端路由 – 难怪我们如何处理这个问题,我们总是结束负载均衡器单点故障。 所以问题是…我们如何build立两个托pipe站点之间的负载平衡,使负载平衡器不是单点故障? 有没有办法使用两个独立的负载平衡器,每个站点一个? 我们应该考虑循环赛DNS吗?