服务器故障切换场景

我有两台Dell PowerEdge 2950服务器。 为了(希望)消除任何停机时间,我必须实施一个解决scheme来检测和调整组件故障,环境故障等…通常的“停机时间是敌人”的情况。

从这一点来说,我将把服务器称为服务器 ,因为实现的解决scheme可能会将两台服务器组合成一个逻辑服务器(老实说,一个逻辑服务器将是首选)。

我将有~15个瘦客户端都指向上面提到的服务器。 服务器将作为terminal服务器。 客户端将连接到服务器并运行客户端GUI的一个实例。 实际的服务器本身将运行相同应用程序的服务器版本 ,为客户端GUI提供所需的信息/数据…(我希望这是有意义的!)

我被推荐使用Marathon Technologies everRun 2G软件。 虽然这似乎是一个公平的解决scheme,它也是$ 12,000 …似乎有点昂贵,(可能是我显示我在这个领域的经验不足)

对于这种情况,是否有更具成本效益的解决scheme? 目前,我一直在检查涉及Citrix XenServer的解决scheme,但尚未取得很大的成果。

如何实现上述程度的容错?

编辑:服务器正在运行Windows Server 2003企业。

编辑 :为了澄清我的沟通不畅,我正在拍摄故障转移到仍在运行的节点。 要托pipe的应用程序提供了大量电子锁门和对讲机的控制。 因此,如果应用程序不可用,则不会打开门,也不会通过对讲机进行通信。 哎呀!

编辑 :那么,经过一些范围的变化,资金和其他非技术项目的调整,我向前迈进的解决scheme实际上没有列出任何方法:)长话短说,我们维护两个独立的terminal服务器; 一个主要和一个热备份。 在紧急情况下两者之间的切换将是手动的(尽pipe如果不是我们最初预期的速度,速度实际上会一样快)。 服务器硬件(两个NIC,两个电池供电和两个UPS)将解决所需的故障切换function。 感谢您的反馈,非常感谢!

我怀疑你是否真的需要高可用性,或者如果你只是在发生硬件故障时需要故障转移到仍在运行的节点。 医pipe局的费用将会非常昂贵,而且有很多用户,我认为你的预算并不是那么高。

您是否考虑过使用Microsoft的内置terminal服务会话目录function和负载平衡器? 您已经拥有了Windows Server 2003的“企业版”,因此就实施会话目录function而言,您已经“过了坎坷”了。

一些更多详细信息: http : //download.microsoft.com/download/7/b/3/7b3aa957-4865-427d-9650-789179a5d666/SessionDirectory.doc

您也可以查看一些第三方工具,如2X Loadbalancer 。 (虽然…没有亲身经历)

马拉松是一个非常重量级的系统,它有效地减半了系统的容量。 首先,我会确保您拥有像共享存储一样的基础知识。

今天,VMware可以提供高效的HA服务器,当其中一个系统发生故障时,服务器可以重新启动,在未来,VMware将能够跟踪机器,以便当其中一台服务器死亡时,实例将被“透明地”迁移到另一台服务。

我会指出,除非你确实需要HA,否则通常最好有一个简单的系统,而不是一个复杂的系统,它应该更可靠,但实际上不是。

就像James所说的那样,如果真的那么重要的话,那么从VMWare加载物理服务器到ESX可能是值得的。 使用这种基础架构,您可以将Vmotion与VMWare的HA工具结合使用,使服务器可以在物理服务器之间无缝停止地移动到最终用户。 这需要一个SAN以及一个独立的盒子来运行pipe理软件,但pipe理软件可以像桌面一样运行。

我将担保Citrix XenServer,但与VMWare一起从来不是一个错误。 如果有的话,它可能会伤害企业钱包。

就像Charles评论的那样,您需要SAN(或NAS)或某种共享存储来真正利用VMWare的High Availability / VMotionfunction。 但要回答你的问题:

对于这种情况,是否有更具成本效益的解决scheme? 目前,我一直在检查涉及Citrix XenServer的解决scheme,但尚未取得很大的成功。

Citrix XenServer 5.5和XenCenter都是免费的(比如ESXi),但IMO具有更多的function,可以让您更接近“消除停机时间”的目标。 但是无论使用Xen还是VMWare,都需要与产品要求兼容的共享存储。

如何实现上述程度的容错?

那么,你的总体目标听起来像高可用性,现在你要求容错。 IT领域内两个不同的概念。 我想说给出的所有信息,可能有更好的select,而不是直接进入虚拟化的高成本。 15个会话对于您的服务器来说并不算艰难。 也许虚拟化在这个时间点是有点多,也许你可以逃脱没有它。 在两台terminal服务器之间进行负载平衡,以减轻负载,直到需要更多客户端,然后查看所有内容的虚拟化。

另一个想法是:您可以使用VMWare ESXi或XenServer 5.5进行虚拟化,并且虚拟化,但现在不具备HA / VMotion-esquefunction。 然后,当你真的需要使用这些function时,购买升级服务,并在两台服务器之间共享一些共享存储。 这样,您就不必事先进行P2V转换。

这里有一些选项,我会看到..

只需在两台服务器上安装一切,包括terminal服务,然后使用内置于Windows服务器的服务来使用“群集IP”,这样每个人都连接到一个IP地址,两台服务器将决定谁连接到哪台机器,给出一个伪负载平衡情况。

另一种方法是投资VMWare的工具套件,以便将VM用于terminal服务,然后使用VMotion和高可用性选项使VM保持活跃状态​​。

企业高可用性的大多数情况似乎需要两台服务器加上一个高速SAN或iSCSI存储系统,以便在两台服务器之间保存虚拟机或共享数据,然后服务器的应用程序服务在连接到存储的两个系统上运行服务器。

也许可以在Linux上使用DRBD和Pacemaker来安装Xen,但是我认为也许只是在Windows上使用“集群IP”来释放两个terminal服务器之间的连接可能是足够好的,可能是使用NAS或其他存储服务器共享应用程序数据目录或主目录中的数据。 这会工作吗?


我想你有点编辑你的问题了? 无论是,或者我掠过太快:-)

15个用户使用terminal服务去两台服务器; 我认为,对于预算问题和pipe理,您可能仍然最好考虑启用内置于terminal服务中的负载平衡 。

一些警告:一个用户可以杀死每个人的terminal。 在查看weather.com的animation时,我们有一个用户离开loginterminal。 几个小时后,内存使用或CPU使用膨胀到其他人陷入几乎无法使用的状态。

此外,如果发生断开连接并且用户重新连接到第二台服务器,则可能会在networking出现故障时他们正在使用的应用程序的位置或主服务器上的文件共享问题混淆,因为服务器上的文件已打开,现在重新login到服务器两台。

换句话说,无论您的服务器如何,都要依靠terminal服务,这意味着拥有良好的基础设施。 这意味着更多的钱在pipe理交换机和可靠的布线等。 而且您应该有一个IT部门准备好监视这些服务器的exception情况,以防止用户占用资源,因为一个人可能会遇到级联到其他用户会话的问题。

我想说,既然你提到第二台运行ESXpipe理软件的电脑会被人诟病,你唯一的select就是负载均衡。 几乎所有其他解决scheme都将涉及购买共享存储,这可能会开始接近您为这两台2950支付的费用。