build立服务器场 – 我应该使用便宜还是昂贵的硬件?

我正在为Web业务构build一个服务器场,我将需要前端Web服务器服务器和一个普通的NAS文件服务器后端。

一些公司select购买最昂贵的最可靠的硬件。 其他公司则select购买价格较低廉的个人电脑硬件,但更多。 他们构build高度冗余的系统,当他们失败时,他们会换掉。 我相信Google采取了后来的方法。

有没有人有任何具体的生活经验和build议给我?

这取决于您的应用程序和容错失败。

如果您正在为金融业务运行Oracle数据库,则需要昂贵的具有可热交换部分和内置冗余(电源,磁盘,甚至cpu和内存)的服务器。

如果是具有NAS存储的networking服务器或计算服务器,只要能容忍丢失一个盒子而没有太大影响,便宜(在服务器上,而不是在NAS上)。

不要这么便宜,以至于你不断更换坏的硬件。

对我来说,一般的经验法则是使用RAID来保护重要的基于磁盘的数据,但是为计算和networking场购买便宜的商品硬件。 获得一个好的负载平衡器,可以检测到networking服务器没有响应时将其标记为离线。

真实的生活经历:

不好的:在商品硬件上运行oracle是一个便宜的解决scheme,我们可以很快地把它们放在一起,但是一个坏CPU风扇导致服务器崩溃,迫使我们从磁带恢复Oracle(唉!)。

好:我们用70台商用机架式服务器replace了2台高端冗余机器。 我们能够在2台机器上停止维护,并开始购买2500美元的备件。 在大约2年的时间里,我认为我们只使用了大约6个“备件”(真正的挑战是避免为其他目的部署备件)。

就我个人而言,我向客户推荐那些需要高度可靠的电脑是具有当前顶级支持的名牌电脑。

在“星际迷航”的外星人赛后,我称之为“打包级别的支持”,因为您应该能够在白天或晚上打电话给我,并说我是$ COMPANY的$ NAME。 我的支持合同号是$ X。 我的电脑是$ TYPE,系列$ NUMBER。 它被打破,使它去,并期望有一些人会出现2-4小时后,做到这一点。

现在要为这种支持付出高昂的代价。 但是,如果你一定要起来,这是值得的。

在大多数情况下,我更喜欢预assembly的计算机,并提供保修和支持,因为通常不值得向客户支付规格,订购和组装便宜的电脑。

对于电脑,你可以忍受几个小时/天,更便宜的硬件可能是好的。 例如,如果我有五个Web服务器,我会希望其中两个是高度可用的,并将容忍其余的更便宜。 对于计算农场,我会用更便宜的硬件。

build立热插拔服务器是非常困难的。

去昂贵的。

杰夫在这个主题上有这个不错的博客post,他也在看能源和许可证费用。

根据我的经验,便宜的硬件也花费很多。 我相信你不需要专业服务器的高端模式来服务于几个网站。 但是你不想错过

  • 热插拔电源
  • IPMI(远程pipe理)
  • 真正的硬件RAID控制器的系统磁盘
  • 空气stream通良好的底盘

此外,如果它适合您的Web应用程序,请考虑使用良好的负载平衡器,HTTPcaching(例如Squid ),PHPcaching(例如ACP )和memcachd 。 这可能会过时一些相当繁忙的站点上的一些后端服务器。

气stream,气stream,气stream。

find一个当地的供应商,build立一个价格合理的机器,研究这些零部件,这样你就不会购买柠檬零件,并确保它在整个过程中都有大量的空气。 当齿轮保持冷却时间更长。 冗余是好的,但取决于你的组织规模可能是矫枉过正。 如果你想要冗余,那么也许你应该考虑购买更多容错性(hdd,cpu,mem,psu,粉丝等)和运行虚拟服务器的机器。 这样你就可以在你的服务器上获得容错,以及运行虚拟机的附加优势。 但是,保持数据库服务器分离硬件或者至less让它们写入专用RAIDarrays是一个很好的做法。

一些最昂贵的硬件有一些最便宜的4小时响应合同。

我知道的最贵的硬件是最便宜的,但制造商无法/不愿意在硬件损坏时解决问题。 他们也有最昂贵的服务合同续约(结果是无用的)。

在没有大的停机时间的情况下,为了达到3到5年的系统寿命,您不希望您的条目被标记为“未完成”。

我认为这完全取决于你的情况……这取决于你是否想要责怪或维护你的内部维护。

如果你更愿意承担供应商的责任,那就去高端的合同寻求支持。 如果您想省钱并build立一批IT支持人员,而这些人员将会随着时间的推移而获得更多的收益,那么可以使用内部硬件,这种硬件的成本更低,但硬件更多。

你可能应该坐下来分析一下灾难计划和单点失败,并将其与你可能失去多less钱相比较。 我不知道你对服务器有什么样的要求,但是我可以说,如果你的企业绝对需要IT服务的话,你需要计划好每一件事情,如果你能…驱动器坏了,离线备份,在服务器机房中发生火灾(或断电…你有多less种方法在那里获得电力?),控制器故障,主板故障等等,你可以在没有服务的情况下多久才能使业务瘫痪,那么多less是不是值得下去(或引导到你的支持需求)与你将失去多less时间,以获得另一个系统?

如果你有一个好的员工,你可以考虑投资于相同的服务器和VMWare与iSCSI或SAN解决scheme与RAID加上一个良好的后端存储备份服务器。

分析您的需求,仔细检查每一种可能出现的故障情况,看看冗余的成本是多less,并制定相应的计划来处理这些紧急情况,然后看看您是否想要信任一个为这些问题提供有保证服务的供应商,或者如果您想要你的内部人员要做好准备。

说实话,我首先从商业的angular度来看待这个问题。 这是一个依赖于业务需求的技术问题。

所以问问自己一个问题。 进入这一点,这对你来说更重要,系统可用性还是降低成本? 如果让这个系统在没有停机的情况下运行是一个需求,那么看看这个高端硬件肯定是有利的。 但是,如果您担心您的预算节俭,那么使用低端系统的第二个select也是有道理的。 我已经使用工作站作为服务器来降低成本,只是习惯于构build它们,所以如果在工作站上运行的服务器发生故障,它可以快速转换到另一个冗余服务器。 虽然这不会赢得速度恶魔奖。 这将弥合第一天和当你有适当的现金stream量投资适当的行业标准解决scheme的时间之间的差距。

需要考虑的另一件事情是,如果服务的硬件更容易出现人力和材料故障,那么将花费多less成本呢? 有时候,如果你知道支持低端硬件将会把你放在第八位,那么采取这种冒险是有道理的。

只要我的$ 0.02 …希望这给你的东西咀嚼。

选址无疑是影响能源消耗的最重要因素之一,也是计算成本的一个重要因素。 比美国大陆气候凉爽的地方还有更多的绿色电力。 我会build议任何人考虑select一个数据中心来看看芬兰网站上的这些问题: http : //www.fincloud.freehostingcloud.com/