Articles of 故障转移

在SoftLayer中设置Windows Server故障转移群集

我正在尝试创build一个Windows Server故障转移群集。 我已经成功创build了Active Directory。 我目前正处于这个阶段: 在屏幕截图上,模糊的地方有子网/networkingID,如xxx.xx.xx.xxx/xx。 在旁边,它说“点击这里键入一个地址”。 只要我明白,我必须提供一个特定子网的地址。 这是问题。 我正在尝试在SoftLayer中的生产环境中设置故障转移群集。 当我使用Oracle的VirtualBox在实验室环境中尝试群集时,我没有任何问题,因为networking完全在我的本地机器的控制之下。 但是,在Softlayer中,它们不提供来自子网的空闲/可用IP地址。 所以我没有公开的知识产权投放到那个位置。 我能在这种情况下做什么?

在故障转移群集中同时发生服务器崩溃

在故障转移群集中有两台服务器。 集群定义了一个共享的“ClusterStorage”驱动器。 驱动器通过iScsi映射到SAN设备。 最近,两台服务器同时自行重新启动。 服务器和群集的事件日志中的错误表示服务器无法访问/写入共享驱动器。 每个服务器都可以通过2个不同子网上的2个独立networkingpath使用2个网卡访问SAN。 SAN有2个控制器。 SAN上的事件日志不会报告与此事件相对应的任何错误。 另外,也使用SAN的数据库服务器(通过群集上定义的SQLangular色和专用驱动器)没有报告任何IO错误。 这似乎表明SAN很好,可以到达。 然而,这两台服务器自己重新启动,通过集群破坏了冗余。 集群事件 – MAPLE重新启动 在MAPLE上pipe理事件日志 系统甚至loginMAPLE 任何想法在这个重新启动的实际原因?

Nginx负载均衡器在故障转移服务器上显示错误的站点

我有五个网站,我有三个服务器,所有运行nginx。 主服务器 负载平衡器 故障转移服务器 每个网站都有自己的主服务器,但他们都共享相同的故障转移服务器。 我的负载平衡器设置为发送所有stream量到每个网站的主服务器。 只有当主服务器closures时,负载均衡器才会将stream量发送到故障转移服务器。 对于每个网站,我在负载均衡器上都有一个单独的nginxconfiguration文件,与以下类似: upstream website { server 1.2.3.4 fail_timeout=3s max_fails=3 weight=10000; server 4.3.2.1; } server { listen 80; server_name www.websitename.com; client_max_body_size 150M; location / { proxy_pass http://website; } } server { listen 80; server_name websitename.com; client_max_body_size 150M; location / { proxy_pass http://website; } } 有了这个configuration文件,一切正常。 所有stream量都发送到主服务器,如果主服务器closures,stream量将被发送到故障转移服务器。 问题出现在故障转移服务器上。 我在故障转移服务器上有五个不同的网站,所有这些网站都在site-available目录中有自己的nginxconfiguration文件。 问题是,当stream量发送到故障转移服务器,nginx显示第一个可用的configuration文件和关联的网站,而不是正确的网站。 故障转移服务器上的每个网站configuration文件都如下面的configuration文件。 […]

学校项目中的容错/故障转移

我正在学习分布式架构课程。 课程参与者分成几组。 每个小组都必须开发一个MMORPGtypes的游戏机并设置基础设施。 讲师有一个脚本,每小时根据我们提供的IP检查游戏的可用性。 在课程结束时,所有小组都根据游戏的正常运行时间百分比获得积分。 我的团队已经selectDigitalOcean作为IaaS,我们正在Docker容器中运行我们的游戏。 我们已经经历过DigitalOcean重新启动托pipe我们游戏的实例(没有预先警告),不幸的是,我们没有任何脚本来重启Docker容器。 我们小组提供给脚本的IP直接连接到DigitalOcean上的液滴。 这意味着,如果机器出于任何原因停机,我们不会采取任何措施。 那很糟糕 。 我一直在寻找解决scheme,并find了两个: 虚拟IP 现在,纠正我,如果我错了 – 但这实际上允许多台机器尝试获得一个IP的所有权。 所以如果一台机器死了,其他人可以无情地接pipe。 这似乎是最好的解决scheme,但DigitalOcean不支持它(据我所知)。 DNS故障转移 您提供了多个A型logging到DNS服务器,它将持续监视您的服务器。 如果其中一台服务器发生故障,并且DNS服务器收到parsing请求,它将以一个有效的IP进行响应。 注意事项是TTL和caching。 还有什么其他的select可以为我工作? 是否有可能configuration虚拟IP与其他供应商,并与我目前的供应商(DigitalOcean)一起工作?

如何使用Hetzner Online为高可用性configuration故障转移IP

我有一个在实验室中的虚拟机中运行的3个Ubuntu节点的集群,现在想把它带到生产环境。 Hetzner Online hetzner.de提供了一些价值很高的专用服务器,所以我租了3台机器,连接了一台千兆交换机。 我的意图是在两台HAProxy服务器之前创build一个HA-Setup,两个Keepalived。 Keepalived在我的设置中configuration了一个VIP。 不幸的是,这不适用于Hzzner。 然而,他们提供了一个称为故障转移IP的系统,可以在脚本的帮助下切换到其他服务器: http : //wiki.hetzner.de/index.php/Failover_Skript 我的keepalivedconfiguration如下所示: vrrp_script chk_haproxy { script "killall -0 haproxy" # cheaper than pidof interval 2 # check every 2 seconds weight 2 # add 2 points of prio if OK } vrrp_instance VI_1 { state MASTER interface eth0 virtual_router_id 51 priority 101 virtual_ipaddress { 192.168.56.101/24 […]

2节点故障转移群集

我需要构build一个2节点的Hyper-V故障转移群集,这是非常简单的权利? 问题是硬件已经被购买了。 这两台服务器是相同的,并批准 相关规格: 适用于操作系统的250GB驱动器(Microsoft Hyper-V 2k12 R2) 14TB raid10驱动器 64GB内存等。 另外我们有一台Synology DS415 + NAS,但是我的老板想把内置的驱动器当作CSV使用,而NAS将作为一个见证磁盘(有2TB的驱动器…… 叹气 ) 如果有可能,是否有适当的方法来做到这一点? 购买另一台NAS用于集群存储不是一种select。 起初,我正在考虑同时制作iSCSI Target Server和Initiator两个节点,但是我不认为这是正确的做法!

Azure Web应用程序体系结构的外观如何?

我已经有10到15分钟的几次中断,因为显然微软在他们的存储上有一个“昙花一现”。 他们告诉我,这是因为实例之间共享文件系统(使其成为单点故障?) 我不明白这一点,并问如何涉及文件共享 ,因为我会假设一个非常愚蠢的无状态的IIS应用程序与SQL Azure通信的数据。 我会假设下面的情况: 这是他们对我的问题的回复(我没有包括图纸) 文件共享不一定会让您的networking应用程序与其他资源进行通信,但是它们位于应用程序内容所在的位置。 当我们build议我们的文件服务器上存储不可用时,这就是我们的意思。 为两个实例上的应用程序触发重新启动的原因是因为资源是共享的,所以两个实例的底层存储都是相同的。 这是一个原因,最后也会跟着。 如果您真的想要改进应用程序的可用性,您可以随时使用stream量pipe理器。 但是,即使使用stream量pipe理器,也不能保证应用程序不会closures,但会提高应用程序的整体可用性。 另外,我们最近推出了一个生产更新,理想情况下应该考虑由存储单元引起的重新启动,但是要启用此function,您需要确保在以下情况下有足够的内存可用:这个function需要启动。我们有几个选项可以设置,以避免应用程序意外的重新启动,因为我们的结尾存储blip: 您可以评估是否要移动到更大的实例,以便我们可以有足够的内存来使重叠回收function被踢入。 如果您不想移动到更大的实例,则可以使用本文早期电子邮件中概述的本地cachingfunction。 由于时间的差异,沟通需要时间。 谁能告诉我我的想法有什么问题? 我唯一想到的是当你启用了两个实例时,它们运行在同一台物理服务器上。 但这对我来说确实没什么意义。 我有两个实例一个核心,1.75 GB的内存 。

使用CNAME Apache启用HTTPS

我有两个Apache服务器,这两个主机名是primary.domain.com和secondary.domain.com 主服务器将rsync并将所有文件镜像到辅助服务器作为备份。 我正在试图让中学像一个故障转移。 我试图设置一些CDN通过cdn子域通过这些服务器,所以我会使用cdn.domain.com指向primary.domain.com 但是,如果主服务器发生故障,我很快就想要将cdn更改为辅助服务器,但所有这些都是使用HTTPS完成的。 我已经在主服务器和备用服务器上安装了SSL,但HTTPS CNAME不起作用。 我如何使它工作? 我试着用cdn来更改ServerAlias,但是它不起作用,我怎么做才能让redirect可以有HTTPS? 或者是不可能的? 谢谢

在VPS云服务器上托pipe大型群集数据库的性能问题

我想知道有没有人碰到这个问题? 您可以在DigitalOcean等某些云中获得一些健壮的12核VPS实例,并在“主动 – 被动”群集configuration中为其设置数据库。 一切工作起来都很好,与专用服务器相比,你节省了大量的资金,而且还有高可用性。 如果您长时间未故障转移此群集,您的云提供商将会注意到您的备用服务器从不使用这12个CPU。 而且他们会将一堆其他VPS实例添加到主机中,以消耗所有未充分利用的容量。 然后,您的下一个故障转移会导致重大灾难,因为您的主机服务器不堪重负,您的数据库无法处理正常的负载。 你知道这个问题的任何解决方法,不花钱吗? 我正在考虑安排一些脚本来检查最近的系统负载,并创build一些人造的工作负载,以确保虚拟机pipe理程序不会低估备用服务器的资源需求。您是否有更优雅的选项?

Azure SQL数据库故障转移,但使用相同的DNS名称

我正在研究如何使用PaaS App Service和DBaaS SQL Database产品在Azure中创build高度可用的Web应用程序。 Standard数据库包括Standard Geo-Replication以自动将数据库复制到预配对的Azure区域 。 当我创build数据库并设置地理复制时,需要我创build一个新的服务器以及一个新的数据库。 这意味着每个服务器都有自己的DNS名称(例如mySqlServer.database.windows.net vs mySqlServerFailover.database.windows.net )。 我希望我的App Service使用一个自动指向任何可用数据库的DNS名称。 优选地,该DNS名称也将被地理复制,确保即使整个数据中心停机,我的站点仍然可以在没有干预的情况下可用。 当数据库故障结束时,我宁愿不必更改web.config文件中的设置。 有没有可用的选项? 或者是否需要有人准备在故障转移期间切换站点?