Articles of 故障转移

虚拟机的Linux文件系统在Citrix XenServer中崩溃或只读

我读了一些与这个问题有关的答案。 如果系统分区在短时间内无法访问,操作系统是否会崩溃? 但是我解决不了这个问题 如果在XenServer上使用ISCSI作为存储库,并且DomU(VM)处于繁重的磁盘I / O中,如果ISCSI连接丢失(主要是networking连接问题/存储故障转移),则DomU文件系统(特别是ext3 linux文件系统)崩溃。 在这种情况下,DomU的ext3文件系统变成只读或不可恢复的。 如何在Dom0连接丢失的情况下保护虚拟机的文件系统? 这是我的XenServer环境。 [root@cnode01-m ~]# iscsiadm -m session tcp: [1] 10.32.1.240:3260,2 iqn.1986-03.com.sun:02:c5544ae6-9715-6f38-f83b-a446896ac614 tcp: [3569] 10.32.1.240:3260,2 iqn.1986-03.com.sun:02:5c41ce31-3fbb-c6aa-d479-947e85515ac7 [root@cnode01-m ~]# vgs VG #PV #LV #SN Attr VSize VFree VG_XenStorage-1aeee13b-2a87-1d0d-1834-7b8c868009b0 1 40 0 wz–n- 6.35T 4.93T VG_XenStorage-28e2c663-dae5-9504-9733-e05063ff081d 1 57 0 wz–n- 6.35T 4.52T VG_XenStorage-365d6e13-5caa-1fea-9940-e1bb553e3513 1 42 0 wz–n- 6.35T 5.13T VG_XenStorage-4ea23f9a-f945-5d45-cbd2-f3eab3fe75b3 […]

如果主服务器closures,则configuration辅助DNS工作(绑定)

我有一个绑定主从DNS服务器设置。 辅助DNS服务器工作正常,并解决发送给它的任何查询。 但是,当主DNSclosures时,似乎辅助DNS也会closures(使用pingdom来监视这两个服务器)。 这是我不希望发生的事情,我希望辅助继续解决查询,直到主服务器备份。 我想我错过了某种configuration设置,但我的谷歌search还没有发现那是什么。 任何帮助,将不胜感激。 从站configuration options { listen-on port 53 { any; }; listen-on-v6 port 53 { any; }; directory "/var/named"; dump-file "/var/named/data/cache_dump.db"; statistics-file "/var/named/data/named_stats.txt"; memstatistics-file "/var/named/data/named_mem_stats.txt"; allow-query { any; }; recursion yes; dnssec-enable yes; dnssec-validation yes; dnssec-lookaside auto; /* Path to ISC DLV key */ bindkeys-file "/etc/named.iscdlv.key"; }; logging { channel default_debug […]

使用RAID 1和NBD创build磁盘镜像以进行故障转移是不是一个好主意?

我想要做的是在故障转移机器上创build一台机器磁盘的镜像,这样,如果主机发生故障,我只需重新启动故障转移,select一个不同的根分区,然后准备就绪。 我这样设置: 主要机器和故障转移机器。 两台机器都有一个定义的RAID分区。 故障转移机器通过nbd-server为其RAID部分提供服务。 主机通过nbd-client安装故障转移的RAID分区。 在主机上,两个RAID分区通过mdadm合并到一个RAID设备中,远程分区的–write-mostly标志被设置。 我写了一些脚本来自动启动所有的东西,在故障转移中configurationgrub,以便它有正确的选项,允许你从小的镜像分区或故障转移分区启动。 我testing了它,它工作。 我遇到的问题是,大约每周一次,主机似乎完全冻结。 您不能ssh进入它,控制台将不会响应,并在重新启动机器后,日志条目只是在某个时间停止,没有在日志中指示错误。 我断开了NBD分区,只用RAIDarrays中的本地磁盘运行了所有内容,运行了一个月,没有任何问题。 NBD不稳定? 可能RAID决定断开本地分区并在networking出现故障的同时运行nbd分区? 这只是错误的方式去呢? 谢谢。

Haproxy在服务器故障事件

我有一个HAproxy服务器(前端)和多个Web服务器(后端)的设置。 是否可以configurationHAproxy,以便在Web服务器出现故障时执行脚本?

如何正确closuresWindows Server 2008 R2群集?

我们需要closures在MS Windows Server 2008 R2 Enterprise的两个节点上运行的MS故障转移群集,以便进行硬件维护。 最近我遇到了两种关于如何closures集群的方法: 第一种方法说,要使群集资源脱机,并进入Windows关机,另一方面,如果右击FCpipe理单元中的群集名称More Actions…您将Shut down Cluster… 这两种方法有什么区别? 推荐closures集群的方法是? 它是在群集上运行什么样的资源,即MS SQL,Hyper-V,自定义应用程序吗? 这是主动/被动群集。

故障转移群集客户端访问点只响应所有者节点上的Ping

背景 我们在安装了SQL Server的Azure上运行两个虚拟机(Windows Server 2012 R2),并将其设置为可用性组。 当然,我们还有另一台虚拟机作为专用DC。 这些都是通过一个虚拟networking连接的。 这个设置对我们来说工作得很好,而且我能够从本地的物理机器上连接到SQL,没有任何问题,但是在帐户上达到了支出限制,并且取消了所有的设置。 我们删除了限制,并且我再次分配了所有使用相同VHD的服务器,所有设置(大概)都已恢复,但是我不能再访问SQL Server。 名称定义 为了最好地解释这一点,我们将调用两个节点SQL1和SQL2,可用性组SQL-AG,可用性组侦听器SQL-Listener以及这些都正在运行的Cloud Service(通过设置适当的端点)SQL-CloudService。 SQL1是故障转移群集angular色的所有者(并且一致地具有主副本angular色),SQL2是次要angular色。 脚本 我能够将RDP安装到两台服务器上,并使用SQL1中的SSMS连接到SQL-Listener,并查看SQL-AG仪表板,该仪表板可以将所有事情报告为健康并同步。 在SQL2上,我无法连接到SQL-Listener。 我也无法从本地机器连接到SQL-CloudService,这也是以前的工作。 两个系统都返回错误, 无法连接到SQL-Listener。 与SQL Serverbuild立连接时发生networking相关或特定于实例的错误。 服务器未find或无法访问。 validation实例名称是否正确,并将SQL Serverconfiguration为允许远程连接。 (提供程序:命名pipe道提供程序,错误:40 – 无法打开连接到SQL Server)(Microsoft SQL Server,错误:53) 找不到networkingpath 当我继续SQL1并通过SSMS连接时,我可以告诉SQL-AG故障转移到SQL2。 它成功地做到了。 但是,这样做之后,我不再能够从SQL1连接到SQL-Listener,但是我是从SQL2连接的。 长话短说,我只能从标有副本angular色的系统中将SSMS连接到可用性组侦听器。 真正的问题 我并不需要能够完成所有这些工作,但是我确实需要能够通过互联网从本地计算机获取SQL Server,而且我认为这些问题是由相同的潜在问题引起的因为他们给出相同的错误信息。 我find的东西 毫不奇怪,给出了错误信息和情况,但是我不能ping通SQL-Listener,除非它在我启动ping的机器上运行。 当SQL1被标记为Primary时,我可以在没有SQL1问题的情况下ping它,但是当我尝试从SQL2尝试时,它成功地使用DNS查找IP,但是回来时显示“Reply from [SQL2's IP]:Destination host unreachable”。 当我对SQL-AG进行故障转移时,另一方面也会出现同样的问题。 但是,我总是能够从SQL2 ping SQL1,反之亦然。 因此,我倾向于认为它是一个故障转移群集问题,而不是一个SQL问题。 因此,这个问题的标题。 我也发现防火墙似乎没有任何改动。 […]

IPTABLES多个公共IP地址

目前我有两台服务器运行Debian 7 HA主动/被动设置使用Pacemaker和Corosync如下: node1->IP->xx.xx.xx.1 node2->IP->xx.xx.xx.2 VIP(Floating IP) ->xx.xx.xx.3 它configuration了心跳以进行故障切换设置。 以上所有知识产权都是面向公众的。 当其他节点发生故障时,系统全部按照高可用性运行。当其中一个系统处于活动状态时,将有两个IP分配给一个服务器。 所以这是我的问题 – 我是否必须为不同的IP(VIP和静态公共IP)添加任何单独的iptable规则? 如何仅允许(监听)特定IP(VIP)上的stream量来为eg-DB服务器服务,而不是来自外部其他公共地址(xx.1)的stream量。 如果你有什么担心安全等问题的设置,请评论.. 谢谢

使用apache2 mod_proxy(_balancer)进行3 + 3的tomcat故障转移configuration

我们有3个活动的Tomcat实例,负载应该在它们之间平均分配(通过jvmroute,ajp粘滞会话)。 我们也有3个故障转移Tomcat实例在运行。 如果其中一个活动实例失败,则3个故障转移实例中的一个应该接pipe。 我想使用Apache2和负载均衡模块来configuration负载平衡和故障转移。 是否有可能在只有一个Apache2实例中实现? 我想到了一个如下的configuration,但是我不知道它是否会起作用,也不会推荐这样做。 <Proxy balancer://Group1> BalancerMember ajp://destination1 route=core1 BalancerMember ajp://destination4 route=core1 status=+H </Proxy> <Proxy balancer://Group2> BalancerMember ajp://destination1 route=core2 BalancerMember ajp://destination4 route=core2 status=+H </Proxy> <Proxy balancer://Group3> BalancerMember ajp://destination1 route=core3 BalancerMember ajp://destination4 route=core3 status=+H </Proxy> <Proxy balancer://loadbalancing> BalancerMember balancer://Group1 route=core1 BalancerMember balancer://Group2 route=core2 BalancerMember balancer://Group3 route=core3 </Proxy> ProxyPass / balancer://loadbalancing/ stickysession=JSESSIONID|jsessionid nofailover=On ProxyPassReverse / […]

如何设置主动/被动(又名故障转移)模式下的ARR?

问题 我正在尝试在NLB + ARR体系结构之后configuration多个Web场(针对不同的站点)。 假设我有6个虚拟机: ARR + NLB 2个虚拟机群集。 它接收stream量并将其转发给内容服务器。 使用HTTP主机头条件的URL重写规则将请求路由到正确的内容服务器。 站点1内容服务器:2个虚拟机。 托pipehttp://www.mysite1.com/ 站点2内容服务器:2个虚拟机。 托pipehttp://www.mysite2.com/ 一切工作正常,我已经testing,我有两个层次上的高可用性。 现在,由于Site 2必须以主动/被动模式工作,所以只有一个虚拟机接收stream量,而另一个虚拟机则用于故障转移。 在某种程度上,我想要类似于NLB的单主机模式,但是对于ARR。 这怎么能实现? 解决方法 我已经尝试了几种间接方法来达到预期的行为。 负载平衡algorithm。 试图设置轮和权重为1/0。 问题是你不能设置0.它必须至less为1.你可以设置40亿+ smth / 1,但我不确定这是否保证没有随机请求进入第二个节点。 主机名称与服务器相关性 在Host Name Affinity的高级设置中,我只能configuration1台服务器分配到Site 2.它工作正常,但问题是2台ARR虚拟机之间路由表不同步。 所以,ARR1不时地将stream量关联到一个节点,而ARR2则关联到另一个节点,而不是主动/被动的。 主机名称关联+ NLB单个主机。 作为先前方法的修改,我还可以将NLB切换到单主机模式以解决路由表同步问题。 在这种情况下,问题是我正在closures站点1的ARR负载平衡。 主机名称亲和力+ NLB单个主机+2个IP地址。 如果我添加第二个IP地址到以前的解决scheme,创build2个NLB群集工作在不同的模式,一切都应该工作得很好。 问题是我不想为第二个公共IP付钱。 没有一个解决scheme是完美的。 理想解决scheme的形象 我真的很想知道如何将ARR置于单主机模式,就像它可以为NLB所做的一样。 让它同步节点之间的路由。 任何人都知道如何做到这一点? 或者知道替代方法?

删除了不会联机的群集磁盘,现在要格式化。 我可以恢复数据吗?

我inheritance了托pipe多个虚拟机和一些存储卷的故障转移群集。 它使用光纤通道SAN进行存储。 我最近更新了SAN控制器上的固件,当它恢复时,其中一个群集磁盘不会在群集pipe理器中恢复联机状态。 我删除了磁盘,并尝试修复失败后再次添加它。 现在,它希望我使用前格式化驱动器。 就SAN而言,一切都很好。 删除群集存储磁盘是否导致磁盘的所有格式化丢失? 我能以某种方式恢复吗? 使用Easeus程序build议,现在有新问题:Easeus检测到我丢失的音量,但它不能恢复它,因为它不会将其注册为丢失。 它认为分区是在那里,格式化和罚款。