我们是一家小型咨询公司,为客户提供一些面向公众的网站和networking应用程序(我们已经编写或inheritance的应用程序)。 我们的优势在于编码,而不一定是服务器pipe理。 然而,pipe理托pipe解决scheme超出了我们的预算(每月费用将超过我们从托pipe这些应用程序中获得的任何收入)。
昨天我们在一台运行RAID5的服务器上遇到双硬盘故障。 很less有这样的事情发生。 幸运的是,我们有备份,只是将受影响的数据库和Web应用程序迁移到其他服务器。 我们真的很幸运,只有一个驱动器100%失败,另一个驱动器被标记为暂停失败,所以我们能够活下去几乎所有的东西[一个数据库必须从备份恢复],我们只有大约5分钟的停机时间客户端,因为我们把他们的数据库脱机并移动它。
然而,我们现在担心,我们已经成长了一些…有机的…现在我们正试图找出我们前进的最佳计划。
我们目前的基础设施(所有裸机):
我们的stream量相当轻,但停机时间几乎是不可接受的。 整天看着CPU显示器,CPU使用率非常低。
我们一直在使用ESXi作为开发服务器主机,并且工作得很好。 对我来说,我们build议在生产环境中运行类似的东西。
我最初的意图是build立一个SAN(按照这样的指导: http : //www.smallnetbuilder.com/nas/nas-howto/31485-build-your-own-fibre-channel-san-for-less-比1000部分1 )承载虚拟机。 我会build立在RAID 1 + 0,以避免我们昨天的讨厌的硬盘驱动器故障问题。
我们会运行当前出现故障的硬盘驱动器上的大部分虚拟机,因为它是最强大的。 在我们目前得到负载平衡的1U服务器上运行其他虚拟机。 P2V旧的保修硬件(除了pfSense,我更喜欢物理硬件)。 继续运行unRaid进行备份。
我有一堆问题,但基础设施的问题是这样的:
我已经确定了一些问题。
你几乎与W2K8R2绑定。 恕我直言,你应该深入了解微软的Hyper-V(我是一个Linux / Unix的家伙!)。 许可模式可能是有吸引力的:购买一个,有三个免费的虚拟服务器(如果我没有正确记得我们的Windows的人说的话)。
我正在使用XEN进行基于SLES10 SP4的PV-Linux虚拟化。 它工作得很好,我真的很喜欢它。 但是我也有一个W2K3服务器(完全虚拟化),我想摆脱它( – > Hyper-V)。
硬盘故障是最常见的故障。 尽量避免使用来自单个供应商的硬盘,并尽量避免来自同一供应商的硬盘的生产月份相同。
尽pipe如此,市场上还没有很多供应商。 因此,您应该实时复制您的数据 – 为您的系统build立更多的HA!
KISS(保持简单,愚蠢!)我相信简单的双节点群集。 把你的服务分成两部分,每个部分都会有一半的服务,但是每个物理服务器应该能够承载所有的服务(可能性能下降很小)。 在您的设置中,尝试将每个虚拟机磁盘数据在线复制到另一端。
使用两个DAS盒可以连接两个控制器(所以两个服务器可以连接到每个盒子)。 在这些框之间进行基于主机的镜像。
要么:
把足够的本地存储放到你的服务器上,并在这些服务器之间镜像这个本地存储主机(如果这个服务器与Hyper-V协同工作,但是我使用的是Linux / DRBD8)。
不,如果现场有足够的更换部件。 硬盘,RAM,电源,CPU,网卡 – 依次排列 – HD和RAM是最常见的。