如果您无法承受或不需要在发生故障时等待上线的群集或备用服务器,您似乎可能会将一台强大的服务器所提供的服务分成两台不太强大的服务器。 因此, 如果服务器A发生故障,则客户端可能会失去对电子邮件的访问权限,如果服务器B发生故障,则可能无法访问ERP系统 。
虽然起初这似乎是更可靠的,这不是简单地增加了硬件故障的机会? 所以任何一个失败都不会对生产力产生太大的影响,但是现在你要把自己的失败率提高一倍。
当我说“不那么强壮”时,我真正的意思是更低的组件规格,而不是更低的质量。 因此,一台机器规格可视化与两台服务器的规格相比,每个规格都要小一些。
通常build议使用SAN,以便您可以使用集群或迁移来保持服务。 但是SAN本身呢? 如果我要将钱投入到发生故障的地方,那么不会出现在基本的服务器硬件上,这与存储有关。 如果你没有某种冗余的SAN,那么这些冗余的服务器就不会给我一个很好的信心。 就个人而言,对于小型企业来说,投资具有冗余组件和本地驱动器的服务器会更有意义。 我可以看到SAN在价格和灵活性方面具有成本效益的大型业务中的优势。 但是对于小商店我并没有看到这个说法,至less不是为了容错。
这一切归结为风险pipe理。 对您的IT系统进行适当的成本/风险分析将帮助您找出花费的位置以及您可以或不得不忍受的风险。 有一切与成本相关……这包括HA和停机时间。
我在一个小小的地方工作,所以我理解这个斗争,而且我的IT怪人想要在任何地方都没有单点故障,但是在每个级别上做这件事的代价并不是一个现实的select。 但是这里有一些我没有预算庞大的事情就能做到。 这并不总是意味着去除单点故障。
networking边缘 :我们有2个互联网连接T1和Comcast业务。 计划将我们的防火墙转移到一对使用CARP for HA运行pfSense的旧计算机上。
networking :为networking核心获取一对pipe理型交换机,并使用绑定在两台交换机之间分离关键服务器,可防止交换机无法取出整个数据中心。
服务器 :所有服务器都有RAID和冗余电源。
备份服务器 :我有一个不像主文件服务器那么强大的旧系统,但是在raid5中有几个大的sata驱动器,每小时对主文件服务器进行快照。 我有脚本安装这个切换angular色成为主文件服务器应该下去。
异地备份服务器 :与现场备份类似,我们每晚通过VPN隧道将服务器备份到服务器上,以备其中一个业主。
虚拟机 :我有一对使用Xen在虚拟机内运行多种服务的物理服务器。 它们在主文件服务器上运行NFS共享,如果需要,我可以在物理服务器之间进行实时迁移。
我认为这是一个有很多答案的问题,但我同意在许多小型商店中的几个服务器解决scheme的作品,正如你所说,至less有一些事情继续下去,如果出现故障。 但这取决于什么失败。
很难涵盖所有的基础,但冗余电源,质量好的电源和良好的备份可以帮助。
对于一些关键系统,我们使用了Backup Exec System Recovery。 不是每天的备份,而是作为一个恢复工具。 我们可以恢复到不同的硬件(如果有的话),还可以使用软件将备份映像转换为虚拟机。 如果服务器出现故障,我们需要等待硬件维修,我们可以在另一台服务器或工作站上启动一台虚拟机,然后跛行。 不完美,但它可以快速启动和运行。
关于SAN:几乎所有使用的东西都是多余的。 即使是单个机箱,内部也将是双电源,双连接器和双“磁头”,每个连接到所有磁盘。 即使像戴尔公司出售的MD3000那样简单,也具有所有这些function。 SAN被devise成是你的盒子的核心,所以它们是为了在任何随机的硬件故障中生存下来的。
这就是说,你有一个观点,冗余并不总是最好的select。 特别是如果它增加了复杂性。 (而且会)要问的更好的问题是……“公司接受宕机多less钱”。 如果一两天你的邮件服务器丢失不是什么大问题,那么你可能不应该打扰其中的两个。 但是,如果networking服务器停机每分钟都会开始损失真实的资金,那么也许你应该花时间为它创build一个适当的群集。
更多的服务器有更多的机会破坏,这是一种看待它的方式。 另一个是如果一个人打破了,你就是100%的吱吱嘎嘎,就像你说的那样。
最常见的硬件故障是HD,就像你上面说的那样。 不pipe你想要在多大程度上进行拆分操作,你都需要将RAID存储起来。
我会选举一些服务器(当然是RAID),而不是一个巨大的服务器,这样既可以提高操作的稳定性,又可以提高性能。 减less软件碰到资源,减less混乱,更多的磁盘读取/写入,等等。
我会亲自select多个服务器。 在这种情况下,我不认为设备故障更可能发生。 是的,你有更多的设备可能会失败,但任何单位失败的可能性应该是不变的。
在非冗余/非HAconfiguration中有多个服务器的情况下,我可以在发生故障时将某些工作卸载到另一台服务器上。 所以,说我的打印服务器出现故障。 如果我在修复打印服务器时可以将几台打印机映射到文件服务器,则对操作的影响就会减小。 这就是真正重要的地方。 我们经常倾向于谈论硬件冗余,但硬件只是连续性操作的工具。
我在一家小店(一个IT部门)工作,在任何情况下都不会把我的多台服务器换成一台。 如果任何一台服务器出现故障,我可以select将现在丢失的服务添加到另一台机器,甚至只是将它们设置在备用电脑上。 对于大多数事情,我们可以忍受一两个小时的停电,但是我们无法承受所有系统的完全停运。 虽然我可以用电脑代替我们的任何一台服务器,但至less暂时我还没有,或者很容易就能把任何东西放在足够强大的地方,以便立即replace所有的服务器。
“起初,这看起来似乎更可靠,难道不是简单地增加了硬件故障的可能性?
从来没有这么简单,大型的服务器可能会做得更好或更糟糕。 他们可能有更高质量的部件,但可能会产生更多的热量,而且不能正确冷却。 一个强大的服务器有更多的内存,更多的CPU等,所以最终也许你在这两种情况下同样多的CPU,所以也许服务器是不正确的单位思考。
由于机会的复杂性,我认为什么是最具成本效益的胜利。 如果您必须支付许可费,根据授权结构,一台大型服务器可能比几台较小的服务器便宜。