Articles of 故障转移

Windows SQL Server群集故障转移不中断

MS SQL服务器集群是否能够在节点之间执行无缝故障切换? 也就是说,客户不会注意到任何改变,除了在转换期间可能会有短暂的延迟。

当apache服务失败时,将心跳转移到失败转移

我目前已经在Ubuntu的linux服务器上很好地设置了心跳,所以如果没有检测到心跳服务(无论是因为服务器closures还是只是心跳服务停止),它都会在辅助服务器上运行我的网站。 所以我们从初始状态开始,工作服务器上的apache在临时状态下死掉,然后辅助服务器上的apache启动到最终状态。 目前如果Apache失败,但心跳不转换不会发生。 有谁知道如何做到这一点?

Windows群集停电后失败

首先,我们有一个运行HA Hyper-V和DHCP的Windows 2008 R2双节点群集。 我们利用后端的Dell MD3000i iSCSI SAN进行存储。 所有的networking都通过冗余交换机和MPIO驱动程序来完成。 数据networking位于与主networking不同的VLAN中。 以下是我们遇到的情况: 我们有时会停电。 我们在机柜中有两个UPS设备,它们可以持续15分钟左右,但是如果我们没有恢复供电,一切都会下降,集群节点,SAN等。 最终电源恢复正常,所有设备都configuration为在AC返回时启动。 但是,当我们像这样完全中断时,集群永远不能正常恢复在线状态。 我们得到像Quorum磁盘不可用等常见错误。另外,我们的两个主要域控制器是虚拟机群集上的虚拟机。 我们确实有一台物理服务器作为另一个域控制器运行,认为这将有助于事情恢复在线状态。 我们不理解的是,为什么系统启动时无法自我恢复,最终还是有可用的DC进行身份validation。 iSCSInetworking恢复在线状态,还有什么我们错过了吗? 我认为这可能与iSCSI启动器服务在群集服务准备就绪时启动不够快有关。 任何想法或事情,我可以发布帮助? 谢谢,布伦特

心跳起搏器3节点/ IP故障切换

我已经设置了两个节点的active/active ip failover与heartbeat和pacemaker遵循zivtech在后端Web服务器的两个负载平衡器上的链接 。 两个LB具有公共IP,每个公共IP用于故障转移,并且如果一磅失败,我检查ips是否被可用的lb接pipe,并且它运行良好。 现在我想添加一个更多的负载平衡器公共IP故障切换(共3 ips),我想这是不可能的心跳。 我该怎么做呢? 有什么build议吗? 谢谢! 编辑:1 尝试直接添加autojoin any点ha.cf文件与autojoin any但crm_mon没有显示第三个节点,就好像它既不添加Online也不Offline 。 ha.cf : ucast eth0 192.168.1.2 ucast eth0 192.168.1.3 ucast eth0 192.168.1.4 ….. node lb1 node lb2 node lb3 …….. autojoin any crm_mon -1 : ============ Last updated: Mon Jan 16 22:29:20 2012 Stack: Heartbeat Current DC: lb2 (47f9c1f7-e24b-4183-b9f0-9082e268578e) – partition […]

辅助DHCP服务器不会在Centos 6.2上启动

我正在尝试创build一个备份DHCP服务器。 服务器时间同步。 主服务器正常启动。 辅助服务器将无法启动。 来自/ var / log / messages的错误是: Sep 15 14:47:45 stream dhcpd: Copyright 2004-2010 Internet Systems Consortium. Sep 15 14:47:45 stream dhcpd: All rights reserved. Sep 15 14:47:45 stream dhcpd: For info, please visit https://www.isc.org/software/dhcp/ Sep 15 14:47:45 stream dhcpd: /etc/dhcp/dhcpd.conf line 25: invalid statement in peer declaration Sep 15 14:47:45 stream […]

是否有可能没有Windows群集自动故障转移的Windows服务?

由于我们SAN的部分故障,我们将消息队列(Active MQ)从使用networking存储转换为使用本地存储。 由于辅助服务器不再与主服务器共享相同的存储位置,因此服务将closures,并且必须在主服务器出现故障时手动启动。 这些服务正在Windows Server 2008 R2标准版上运行。 如果主服务器出现故障,是否有任何方法可以在辅助服务器上自动启动服务? Windows群集似乎需要企业版,我无法在短期内升级服务器。

将Windows Server 2012 R2扩展文件服务器转换回常规文件服务器。 可能吗?

那么…我搞砸了。 我没有做足够的研究,只是检查了头条新闻,然后首先进入Windows Server 2012 R2带来的新的横向扩展文件服务器。 首先一个主动 – 主动文件服务器听起来是唯一的出路,但使用后,看到性能打击,然后做更多的研究(这告诉你基本上只用于非常大的文件),你可能会像我一样跳船! 我的问题很简单。 目前我有一个LUN / DISK专用于我的横向扩展文件服务器。 磁盘(当然是一个群集共享卷AKA CLV)大约是6TB。 我想知道我可以将其转换回正常的文件服务器… 我的想法是,我将删除Scale-Out文件服务器angular色,然后将6TB磁盘从CSV移回到可用的群集磁盘。 然后,只需创build一个常规的文件服务器angular色,并重用我已经等待的6TB磁盘。 我担心的是,CSV或新的横向扩展文件服务器可能有一些时髦的文件系统或一些特殊的东西,当我将常规文件服务器重新联机时,我的数据可能不在那里。 有人曾经尝试过吗?

configuration见证服务器在SQL Server中进行故障转移时出错

我迷失在这里,我正在configuration一个用于故障转移的SQL Server,并有三台服务器。 主体服务器> SQL 2008 R2 见证服务器> SQL 2014 镜像服务器> SQL 2008 R2 所有三台服务器都可以通过IP和FQDN ping另一台服务器。 端点configuration成功,但是当我开始镜像时,出现此错误: Alter failed for Database 'DBNAME' The ALTER DATABASE command could not be sent to the remote server instance 'TCP://witness.domain.abc:5022'. The database mirroring configuration was not changed. Verify that the server is connected and try again. 任何想法这个错误是什么? 我将数据库和事务日志恢复到镜像服务器。 我在证人服务器上做的所有事情都是SQL,还有什么我需要做的? 把我的头靠在墙上。

切换后缀打开和closures

这可能是一个答案,但我不知道如何正确地search它。 情况: 我们有两个节点的故障转移情况,使用keepalived ,在它们之间传递浮动IP。 节点的主要目的是运行haproxy 。 每个节点还运行本地postfix ,仅用于将电子邮件从keepalived或从haproxy到实际的运营商帐户,通过SendGrid中继到外部邮件域。 任何其他机器都不接受邮件。 所有这一切运作良好。 太好; 我的邮箱被淹没了。 我想阻止来自非活动节点的邮件,当故障转移发生时,让postfix突然开始发送邮件。 所以这是这个想法。 正常模式:postfix接受端口25上的邮件,并通过Sendgrid中继。 静默模式:postfix仍然接受端口25上的邮件,但是它放在地板上,不会传递到任何地方,不会将失败返回给客户端,也不会发送反弹。 (是的,这对于一个MTA来说是非常糟糕的行为,MTA不应该接受邮件,但这是一个有限的情况。) 如何判断我应该处于正常模式还是静默模式:一个简单的脚本,可能类似于ip addr | grep -q $FLOAT_IP ip addr | grep -q $FLOAT_IP 。 所以…我想基本的问题是如何“静音模式”发生。 它是一个完全独立的后缀configuration,我必须重新启动与正确的configuration后缀? build立一个After-Queue内容filter会更好吗? 还有其他的想法吗?

最好的“故障转移服务”的Windows可以监视/启动/停止2台机器上的服务?

鉴于以下情况: 2台机器(可能更多,但2个已经很棒了) 他们都configuration完全相同(安装相同的服务) 他们可以在networking中看到对方 是否有可以在两台机器上安装的服务,以及哪台服务器在另一台机器上的同一服务上进行频繁检查? 如果他们都看到对方,那么具有最高优先级的那个将赢得并将启用(或保持启用)所有已注册的运行进程。 其他服务将停止他们机器上的所有注册服务。 如果高优先级机器发生故障,另一个系统将检测到并启动服务。 简而言之:一个故障转移服务 我试图在谷歌上find这样的东西,但没有find任何东西。 我渴望find一个现有的解决scheme,否则我必须推出自己的。