我们公司在两个独立的数据中心的两个集群上运行电子商务网站(数千个)。
基本上,我们需要操作的是机架式服务器节点。 每个节点需要:
1.)4个或8个内核2.)32 GB内存3.)1个250 GB SATA磁盘4.)2个端口,千兆位,以太网适配器5.)能够启动Windows XP专业版
那呢。 我们运行了大约40个这样的节点,一个完全冗余的,总是向上的(希望!)簇(我们自己写了聚簇部分)
以前,我们购买了我们的系统whiteboxed(基本上有一个小店定制我们的服务器(超微)到我们的规格)。
这个scheme运行良好,直到我们上一轮节点采购。 在上一轮节点采购中,出现了超级超高的故障率(6个月内30%失败)。没有任何原因,PSU不好,内存不好,主板炸等等。
我的问题是这些:
如果我们从名牌供应商(IBM / DELL / HP)购买,或者我们基本上和之前的可靠性相同,那么我们是否有更稳定的可靠性呢? 请记住,这些是低端服务器。 我们不打算过渡到大型机或任何异国情调。
我们的可靠性会随着服务器的forms而变化吗? 也就是说,2U服务器比1U机箱服务器中的高密度2个节点更可靠吗?
有人从白盒服务器过渡到名牌服务器(或更改的forms因素),并有一个故事要告诉?
一般来说,品牌名称往往比白色盒子更可靠(虽然在我的世界中超级微型不算是“白色盒子”),但是偶尔也会碰到名牌硬件的运气不好。 但是,如果你的采购量很大,而且有一个更大的孩子,那么你所做的事情往往会很快得到解决。 如果你从一个白盒子厂商那里拿到一批主板,那么他们将会有一堆备用的备件替代它们,而一个大的名字将会让他们的耳朵备受瞩目 – 而且长期忠诚客户(即“现金牛”)将首先获得该股票。
但最终,这是计算机硬件,这就是为什么我们要对所有收到的硬件进行大量的老化testing。 一旦进入大规模pipe理,这种情况会以惊人的规律发生,如果在testing机架上失败,比在生产中出现故障(即使您拥有大量冗余系统)要好得多。
另外,“运行XP专业版” – 你认真吗?
改变build设者,但保持品牌。
真的,超微硬件真的很好。 如果你的失败率如此之高,我首先会怀疑生成的人正在搞砸了。
Supermicro是一个非常可靠的品牌,从主板到完整的解决scheme。
一个好的build筑师应该站在他们的工作背后,尽可能地帮助你。 与戴尔和惠普这样的大品牌合作,将会得到同样的结果。
至于configurationtypes。 你在一个地方的热量越多,故障率就越高。 所以1u中的2个节点将会在2u中放掉更多的热量,然后是1。 如果你的机架有足够的冷却,这应该不是一个因素。
戴尔的一个好处是,他们确实build立了服务器规范,他们在一个非常干净和良好的环境中做到这一点 – 这增加了他们的服务器的长期性。 根据我的经验,从来没有开放服务器增加长寿。 我想说,如果服务器在第一年后工作,它可能会继续工作很长一段时间。 此外,您希望将您的服务器保存在一个良好的数据中心中,以提供电气和物理上的良好环境。 稳定的温度很重要 – 不同的温度会使硬件更快地死亡。
至于forms因素,像知名品牌这样的像样的供应商,都会以这样的方式来包装他们的系统,否定大多数由于forms因素造成的影响。 个人认为这不重要,尽pipe这不完全正确。 戴尔,惠普(HP)和IBM以刀片中心devise而闻名于世。 :-)但是我敢说,无论如何,它们都是相当不错的,所以在一天结束的时候,他们的硬件更换计划就很重要,总体而言TCO就是一个严重的问题。
我们坚持戴尔,因为它比IBM和惠普便宜,因为他们的方式,他们分配他们的东西(build设规格和船),在我的经验,非常低的失败率。 这也节省了我一堆时间。 我上次购买惠普时,我买了30个刀片,包括各种磁盘,存储等等。IT的发货量是316箱。戴尔将会像10个一样发货。:-)我不喜欢花三个小时拆箱硬件,然后有将其拖入数据中心并放入机架(因为这是唯一安全的地方,无论如何都离开硬件)。
随着温度的boost,Id看着55xx系列至强CPU,特别是L型变种。 它们的能源效率通常高达60watts左右。
而且,呵呵,是的,用XP怎么样? 你在XP专业版上运行你的networking服务器吗? 🙂
从大型原始设备制造商购买硬件时,对我而言,卖点在于,与较小的供应商相比,大型原始设备制造商每天都在build造数千台机器,并将其制造\assemblystream程精细地调整为科学。 他们拥有零件制造商和工程师,并且在每个主要的大都市地区都有零配件仓库和维修技术人员。 在交付给您之前,设备不仅要“通过testing”,还需要数千小时的工作经验和工程技术。 恕我直言,这转化为可靠性,稳定性和一致性。
我不喜欢低端硬件的一点是通风。 对于高密度的1或2U服务器,风扇和大量的风扇都非常重要,散热区也是如此。 IBM / HP / Dell服务器具有这样的科学性,并且还具有多种温度/风扇速度传感器和pipe理软件,可以在出现问题时提醒您。
如果你已经掌握了所有这些,我不会专注于硬件品牌的转换。
大多数优秀的服务器的额定温度可达到华氏95度左右,但与通风不良的机架或shell相比,它可以快速升温。