应用程序托pipe的最佳基础结构configuration(IIS / MSSQL)? 裸金属,虚拟化?

我们是一家小型咨询公司,为客户提供一些面向公众的网站和networking应用程序(我们已经编写或inheritance的应用程序)。 我们的优势在于编码,而不一定是服务器pipe理。 然而,pipe理托pipe解决scheme超出了我们的预算(每月费用将超过我们从托pipe这些应用程序中获得的任何收入)。

昨天我们在一台运行RAID5的服务器上遇到双硬盘故障。 很less有这样的事情发生。 幸运的是,我们有备份,只是将受影响的数据库和Web应用程序迁移到其他服务器。 我们真的很幸运,只有一个驱动器100%失败,另一个驱动器被标记为暂停失败,所以我们能够活下去几乎所有的东西[一个数据库必须从备份恢复],我们只有大约5分钟的停机时间客户端,因为我们把他们的数据库脱机并移动它。

然而,我们现在担心,我们已经成长了一些…有机的…现在我们正试图找出我们前进的最佳计划。

我们目前的基础设施(所有裸机):

  • pfSense路由器[老式硬件]
  • 1U DC [不保修,旧硬件]
  • 2Unetworking和应用程序服务器(服务器2K8 R2,IIS,MSSQL,24GB内存,双4C8T至强) – 这有驱动器故障 – [质保好一年,驱动器在保修期内更换]
  • 4Uinheritance的POS服务器(128GB内存,但只有32位操作系统,服务器2K3)[没有保修]
  • (2)负载均衡群集中的1Unetworking服务器(2k8,IIS,4C8T Xeon,4gb ram)(通过pfSense)
  • 1U数据库服务器(2k8,MSSQL,4C8T至强,4gb RAM)[新增保修]
  • NAS以3TB存储空间运行(用于备份和向2个负载平衡的Web服务器提供文件服务)

我们的stream量相当轻,但停机时间几乎是不可接受的。 整天看着CPU显示器,CPU使用率非常低。

我们一直在使用ESXi作为开发服务器主机,并且工作得很好。 对我来说,我们build议在生产环境中运行类似的东西。

我最初的意图是build立一个SAN(按照这样的指导: http : //www.smallnetbuilder.com/nas/nas-howto/31485-build-your-own-fibre-channel-san-for-less-比1000部分1 )承载虚拟机。 我会build立在RAID 1 + 0,以避免我们昨天的讨厌的硬盘驱动器故障问题。

我们会运行当前出现故障的硬盘驱动器上的大部分虚拟机,因为它是最强大的。 在我们目前得到负载平衡的1U服务器上运行其他虚拟机。 P2V旧的保修硬件(除了pfSense,我更喜欢物理硬件)。 继续运行unRaid进行备份。

我有一堆问题,但基础设施的问题是这样的:

  • 这是减轻物理硬件问题的合理解决scheme吗? 我认为SAN成为一个庞大的SPOF,而大型服务器(即将托pipe虚拟机)是另一个。 我读过,付费版本的vmWare支持虚拟机的自动故障转移,这可能是我们正在研究的,以减轻VM主机故障的可能性。
  • 有没有另一种select,我错过了? 我已经考虑了基本上“自动精简configuration”应用程序,我们将使用我们更便宜的1U服务器模型,并运行数据库和应用程序在一个盒子(没有虚拟机)。 在发生硬件故障的情况下,我们的客户群中会有一小部分受到影响。 这增加了我们的硬件成本,机架空间成本和系统pipe理成本(“沉没”在员工时间的成本)。
  • 如果我们确实需要虚拟机故障切换解决scheme,Xen会更具成本效益吗?

我已经确定了一些问题。

  • 什么样的虚拟化对我们有意义(XEN?)?

你几乎与W2K8R2绑定。 恕我直言,你应该深入了解微软的Hyper-V(我是一个Linux / Unix的家伙!)。 许可模式可能是有吸引力的:购买一个,有三个免费的虚拟服务器(如果我没有正确记得我们的Windows的人说的话)。

我正在使用XEN进行基于SLES10 SP4的PV-Linux虚拟化。 它工作得很好,我真的很喜欢它。 但是我也有一个W2K3服务器(完全虚拟化),我想摆脱它( – > Hyper-V)。

  • 我们今后如何防止这样的失败呢?

硬盘故障是最常见的故障。 尽量避免使用来自单个供应商的硬盘,并尽量避免来自同一供应商的硬盘的生产月份相同。

尽pipe如此,市场上还没有很多供应商。 因此,您应该实时复制您的数据 – 为您的系统build立更多的HA!

  • 我们如何正确设置HA?

KISS(保持简单,愚蠢!)我相信简单的双节点群集。 把你的服务分成两部分,每个部分都会有一半的服务,但是每个物理服务器应该能够承载所有的服务(可能性能下降很小)。 在您的设置中,尝试将每个虚拟机磁盘数据在线复制到另一端。

  • 我们如何设置快速,廉价的HA存储?

使用两个DAS盒可以连接两个控制器(所以两个服务器可以连接到每个盒子)。 在这些框之间进行基于主机的镜像。

要么:

把足够的本地存储放到你的服务器上,并在这些服务器之间镜像这个本地存储主机(如果这个服务器与Hyper-V协同工作,但是我使用的是Linux / DRBD8)。

  • 这是使用不受支持的硬件的问题吗?

不,如果现场有足够的更换部件。 硬盘,RAM,电源,CPU,网卡 – 依次排列 – HD和RAM是最常见的。