在数据中心寻找关键的东西

我试图build立一个简单的清单,以确定一个数据中心的质量…在哪里,我应该寻找什么,以及如何确定是否所有者说(例如“我们的UPS保持数据中心100天没有权力“)是否真实? 什么是典型的迹象或好或坏的数据中心?

这是我上次去数据中心购物时为自己提出的问题列表:

  • 解释喷洒器在我们的设备上需要什么。
  • 遥控手将愿意做什么? 例如,安装硬盘驱动器,旋转磁带…
  • 您的远程手牌是全天候提供吗?他们在申请票后平均等候时间到达笼子(如何进入票?)?
  • 你在多个网格?
  • 你有提出地板冷却?
  • 除此之外,您还有多less个数据中心?
  • 数据中心可以在备用电源上运行多久?
  • 我们能否将设备直接交付给数据中心?
  • 是否有一个交付docker和免费,closures和可用的停车场?
  • 如果我们有一个供应商来到数据中心,我们需要陪伴他们吗?
  • 什么环境温度和湿度保持?
  • 有多lessISPselect?
  • 在数据中心的历史上,有没有客户的任何时间都会失去电源?
  • 这个数据中心运行了多久?
  • 什么访问控制到位的地板和设备?

如果您访问多个问题并在价格,访问展示次数和答案之间提出这些问题,则可能会清楚您想要哪一个。 确保你总是访问他们,并访问他们很多。

凯尔覆盖得很好,但这里有几点:

物理安全是巨大的。 它应该采取近乎国会的行动(议会,插入缓慢移动的官僚机构在这里)进入。

它应该有哈龙灭火,不是洒水喷头; 服务器不应该潮湿。 (当地的消防条例可能会覆盖…)

找出他们的首选服务器供应商。 除非出于特定的原因(如运行类似Google的数据中心),否则应该是名牌服务器。 (戴尔,惠普,IBM,太阳,苹果等)如果他们说“白盒”或你不认识的品牌,请运行。 请注意,有一些信誉良好的较低层服务器供应商(例如System76),但是“定制”意味着他们将自己的东西放在一起。 非常适合您的家庭,但对您的数据中心不利。 (这不包括购买惠普Proliant DL580和安装内存选件套件或驱动器笼。)

有什么所有权的select? 通过他们购买? 直接购买并在那里下架? 租赁? 虚拟机?

一如既往的优秀Kyle,我从经验中学到的一些东西:

  • 询问是否有发电机来备份UPS,如果发电机已经过testing,多久?

  • 他们有什么物理锁和检查来防止电工杀死电源?

  • 他们有什么责任/保险?

  • 他们如何处理不符合他们的SLA的情况?

  • 他们多久没有遇到SLA?

  • 他们提供给每个机架/笼子等等多less电力? (你会受到电力的限制,需要另外一个机架/笼子来增加额外的动力吗?)

  • 要求参考,在你的行业会很好。

有趣的故事,当时并不好笑:

  1. 在温哥华发生了一起地下电气隔间的火灾,距离我的DC有4个街区,火势取消了10个方圆的电源。 UPS“一直亮着灯,直到发电机组上线。 在过热之前,发电机组在线停留大约一个小时。 发电机组安全closures后,UPS能够继续照明30分钟。 发现属于该build筑物,国际独立战争联盟能够责怪他们并洗手。

  2. 一名电工杀死了在华盛顿的几排机架的电源,因为这个电路板是如何打倒所有断路器的。 我也听说另外一个电力公司的电工要在UPS上工作,而不是把它放在旁路模式下,并把整个DC关掉。

  • 我想说,大概三分之一的数据中心是技术方面的项目(你们是否有{VESDA,重新加油合同,由UPS覆盖的冷风机,多个电网,不同的光纤入口)。

  • 另外三分之一是当事情不正确的时候,他们如何处理这个问题。 他们是否忍受自尊,检查失败并找出如何去做以确保不再发生? 或者他们只是继续做什么以前没有工作?

  • 另一个是人员。 他们聪明,易于使用,不会每个月都翻身吗?

但更重要的是:他们有空间吗? 我们几乎进入的一个地方,在两年内我们使用的空间比现有的要多。

我在硅谷的一个小型数据中心工作。 我是pipe理服务器端的系统pipe理员。

坏迹象:

  • 缺乏对电力,温度和湿度的冗余监控和警报
  • 缺乏对networking设备,colos,服务器和其他设备的监控
  • 杂物,不使用电缆扎带或其他电缆pipe理,以保持清洁,有组织的机架

良好的标志:现场柴油发电机具有自动故障切换备份冷水机组和空气处理机自动故障切换主要运营商骨干(AT&T,XO Comm)带宽充足冗余networking提供商冗余核心路由器,防火墙,负载平衡器和交换机运行内存检查和硬件诊断部署服务器之前

名牌服务器是好的,但是如果他们已经老了一段时间了,那么最好确保他们在使用硬件之前先通过硬件诊断。

一个好的数据中心应该为其客户提供一个网站,在那里他们可以监控带宽消耗和正常运行时间。 他们也应该回答任何问题。 询问他们UPS的品牌和型号。 要求他们查看UPS上的当前负载。 有了这些信息,你可以validation没有电力可以多久。

但说实话,UPS不应该是你的关注。 UPS只提供短暂的正常运行时间(30分钟左右)。 如果DC有一个备用发电机,则更好的担心。 问问DC是在哪个网格上也是值得的。 就限电和停电而言,将不同的优先级分配给不同的电网。 你猜怎么了? 医院和消防站是高度优先的(权力从未被削减)。 如果数据中心在同一个网格上,则保证可靠的功率。

问他们每个机架有多less电力。 在哪里工作,我们为每个机架提供3个25amp的电路。 典型的1u服务器消耗1-3安培。