监视服务器机房温度

我有一个小型的服务器房间,有自己的空调机组。 最近,AC死了,气温从70华氏度上升到了90华氏度,我们很less去这个房间,所以我很幸运,有人碰巧注意到,当他们走过门时,球迷跑得比正常的多得多。 看起来我需要一个方法来通知当房间里的温度变得太热。

你用什么工具来监控服务器机房的温度? 这个工具如何通知你一个问题(电子邮件,SNMP等)。

注意:我已经阅读了关于服务器温度的这个问题 ,但我对整个房间感兴趣,而不仅仅是服务器的内部情况。

编辑:

感谢所有迄今为止的出色答复! 许多这些产品的测量远不止温度。 还有什么我应该看,为什么?

看一看ITwatchdogs 。 他们的天气鹅线看起来非常好。 他们监视温度,光线,声音,湿度等

以下是有其他产品的供应商 (不是APC) 的列表 。

我在数据中心中使用的内容似乎是停用的模式 。 什么你最终使用,确保:

  • 他们使用SNMP,而不是一些特殊的协议。
  • 有远程温度传感器。 (我不知道netbotz是否…)

目前, 温度监测器从吊顶中间悬挂下来。

使用简单的networking监控应用程序(zenoss,munin,nagios等)只是监测阈值违规,并为您的传呼机/电子邮件创build警报。

您还应该考虑购买一个手持式温度计,并走到数据中心/通讯柜(包括angular落)的每个部分,find任何热点。

一些具体的答案和build议…

1-独立的温度和湿度监测设备有几个制造商(其他答案联系在一起)。 这些都很简单..通常你把它们安装在你想要监视的地方,把它们插入networking,然后configuration它们发送电子邮件警报。 他们工作得很好。

大多数服务器可以在温度超出规格时发出SNMP警报,您可以使用类似Ipswitch的WhatsUp这样的服务来接受这些警报。

您应该提出一天一到两次访问服务器机房 ,可能在抵达和午餐后检查温度和湿度,并检查设备上是否存在不正常,exception噪音等的灯光或状态代码。如果你做不到,那么请别人去做。

如果你想要一个便宜的解决scheme,你可以购买约10USD的USB温度计。 我有一个TEMPer设备。 我还没有使用它,主要是因为它不完全支持在Linux下。 Tollef Fog Heen 写了一些支持 ,但是我没有检查它是否在内核中。 它随Windows驱动程序一起提供,因此只需要将其连接到您的监控。 🙂

我们使用http://www.itwatchdogs.com/提供的MiniGoos产品。 我承认我没有参与这些评估过程,但我真的很喜欢这个产品。 他们允许多个温度传感器,他们有一些漂亮的附加项目,如空气stream量监测(我们目前还没有使用)和门开/关检测(我们是)。 他们有一个HTTP接口,如果你想要的话可​​以被抓取,但也支持SNMP陷阱和民意测验。 我们把它插入nagios,它像一个冠军。

我也是第二,并在他的回答中提出了约瑟夫 。 除了用温度计四处走动来感受房间里的温度模式外,还可以买一些便宜的不连接的温度计,把它们从天花板上挂下来。 它们是报告温度计的很好的备份,你会惊讶地发现,在监测温度计的警告范围越过之前,人们在进出房间时会发现问题的频率。 越早诊断AC / HVAC问题,在开始损坏部件,必须closures机器或自动closures机器以保护自己之前,您必须修复它的时间越长。

+1给Joseph Kern的答案。 我们使用ITWatchdog的一个系统,但是我也使用了其他系统,总的想法很好。

ITWatchdogs以及其他许多供应商都利用达拉斯的1线制总线来驱动他们的传感器。 实际的传感器可以从Farnell等以非常低的价格获得,并且它们基本上连接到一根cat3电缆。 您可以将ITWatchdogs(或类似的)系统与许多手动组装的单线传感器组合成相对便宜的解决scheme。

还有标准的RS232接口(比如这个 1-wire总线),具有不同程度的复杂性,这意味着您可以直接将监控设备连接到服务器,以防您不想运行额外的设备(远程POP例如只有一台机器)

我们有一个类似的设置(数据中心的私人套房,有自己的空调来冷却房间),并使用AVTECH的 TemPageR来监测房间内的温度,并在温度超过一定的温度时收到电子邮件/短信通知阈。 我们使用内部探头监测环境温度,并使用远程探头监测空气直接从A / C鼓风机排出,确保冷却。

我们喜欢这个,因为它是一个完全独立的设备,不需要连接到其他服务器上的软件来运行。 AVTECH生产全系列的环境监测系统,包括温度和水分传感器。

一个更便宜的路线将是使用温度监视器挂钩到您的build筑物安全系统。 如果温度达到设定水平,则联系安全系统呼叫列表中的人员。

尽pipe我们有全室的环境警报,但并不是每个人都有这种奢侈的感觉,我build议你做的是看看你有的服务器,许多已经有温度传感器,结合免费的系统pipe理软件,允许SNMP陷阱和一旦这些传感器超过特定的水平,就会发送电子邮件。 特别是我知道惠普和IBM服务器都有这些,而且我很确定戴尔也是这样。 让我知道你有什么样的产品/模型,我会尽力挖掘一些东西。

低科技 :我在办公室里保持室内/室外温控器。 室外探头穿过墙上的一个小通道到邻近的服务器机房。 一眼就能看到那里的温度。 温度计也跟踪最小/最大温度范围,所以我每周检查一次。

不是在邻近的办公室,只要把探头放在门下面,把温度计挂在房间外面的大厅里,也许?

我也依靠惠普服务器中的临时显示器来实现更自动化的方法,但低技术的显示器在过去实际上更有用。 每当我进入我的办公室时,我都会看看温度。

我们使用Sensatronics设备( http://www.sensatronics.com/ )并使用SolarWinds Orion( http://www.solarwinds.com/products/orion/ )的SNMP进行监控。

过去,我们已经在实验室中发生过几次交stream故障,并且在足够的时间内通过电子邮件提醒(通过在Orion中configuration的电子邮件提醒),让现场的维修人员及时修复,避免温度过高。 其中一个例子是在几个小时之后,所以有电子邮件警报是至关重要的。

还有LM传感器项目。

http://www.lm-sensors.org/

我认识的一个人有一个GSM发射机的探头,卡在服务器机房的一面墙上。 如果出现严重错误,基本上会打电话给他,如果是小问题,就发短信。

我要自己买一个,当我有产品名称时我会回来。

编辑 :这是像无限公司的SCOM-100

APC NetBotz系列产品在环境监测方面非常出色,各种产品允许您监测温度,湿度,气stream,声音等。它还可以与摄像机和门传感器一起使用,以提供全面的安全和监控解决scheme。

我们在几台服务器上使用主板/ CPU温度。 如果同时发出几个这样的警报,很明显原因是什么。 不需要额外的设备。

我有一个安装在服务器机房的APC环境pipe理部门主要监测温度和其他环境因素。 这是一个基于IP的设备,您可以从浏览器进行pipe理。

http://www.apcc.com/resource/include/techspec_index.cfm?base_sku=ap9340&tab=documentation

在我的服务器房间,我使用两种产品。 一个是另一个失败时的备份。 首先是AVTECH 11E,这个装置在我的三个机架的正面和背面使用探头。 我添加了显示器的电源,所以当我的房间停机时它会提醒我。 我有一台备用设备Senturion环境监测仪 ,它也有探头,还可以把房间里的灯,空气stream和温度放在机架上,我可以把摄像机加到设备上。 我比我的AVTECH更依赖Senturion,因为它比AVTECH更精确一些。

我会再次肯顿的职位。 我们使用APC动车组单元,它似乎工作得很好,让我们知道什么时候到了。

低于100美元,你可以从Microdaq获得Lascar的“实时USB温度和湿度监测器” 。

该软件允许你通过电子邮件发送警报并导出数据,虽然它似乎是一个资源猪(至less在我运行它的电脑 – YMMV)。

我们使用APC EMU单元,它们运行良好,但是对于整个房间,我们最近转而使用rfcode.com的基于RFID的有源系统。 它使用温度/湿度标签,可以贴在任何平面上。 我们有一个射频接收机覆盖15K平方英尺的房间。

我们使用一些通过USB连接的温度/湿度传感器。 我们从raphnet.net拿起。 他们便宜,工作很好。 (如果你是一个修理工,原理图可以免费获取)。读取温度的软件是开源的,易于使用,可以很容易地被放入snmp(或者几乎所有的监控系统)。

我们使用Ingrasys Insentry。 有2个以太网模块,我们保留一个在服务器机架的后部,一个在前面,它监视温度和湿度。 它使用snmp,并通过Web控制台查看它。 它也发送警报时,我的电子邮件遇到一个编码(例如太热或湿度太高或太低或太冷等)。 一块蛋糕来configuration。 设置他们,忘记他们,直到aircon死亡。

我们在数据中心有一些事情正在进行温度监测。

SNMP温度监视器。 我们正在使用Sensatronics EM1监视器。 他们有温度和湿度传感器。 我最近又增加了3个传感器,所以我们在我们的主数据中心监测了四个不同的地方。 我们正在轮询来自它们的SNMP数据,并通过MRTG运行它来进行趋势分析和绘图。 当温度或湿度达到一定的阈值时,我们也有大哥提醒我们。 理论上,大学里的实体植物人也在监视房间,但他们似乎并没有像我们那样频繁地注意或照顾。

我们也有一堆站立的温度计/湿度传感器是非自动拨号。 当我们怀疑我们有一个热点,我们可以坚持单位在那里,并在一分钟或更less的时间进行目测检查。

将来我也很乐意把数据从我们的空调机组中抽出来,但是我还没有时间。

编辑:你应该寻找40%至55%之间的湿度。 如果房间太干,静电会成为问题。 太湿,你的驱动器会生锈。

这是一个相当不错的数据中心物理标准的概述,包括温度和湿度的链接。 还有关于安排数据中心和布线标准的信息。

惠普等厂商的许多高端服务器将包含大量可通过IPMI或SNMP进行查询的传感器。 我们所做的就是将我们所拥有的每台UPS,UPS以及任何其他支持任何types温度监控的设备都拿到我们的监控系统(Zenoss)中。

然后,我们将数据汇总到一张图中,这使我们能够很好地了解房间内的温度。

你要找的东西,特别是可以让你监视进风口和排风扇的温度的设备。 在我看来,这给你一个更准确的温度是什么样的想法,因为那样你就知道到底是什么样的空气进出你的服务器。

我们在串行端口和Perl-munin插件上使用达拉斯传感器来监测温度。 非常低成本和自制的,但作品像一个魅力。

在我们的小型服务器机房里,我们也遇到了同样的情况 – 但是我们的一个RAID失败了! 我做了一些研究,发现了一个非常便宜的解决scheme。 当房间温度达到一定温度时,它会通过电子邮件发送给我,或者每隔几个小时给我发送一次最新的温度读数。 花费不到5分钟,挂在$ 130左右。 链接在这里:
http://www.temperaturealert.com

  1. 安全警报也是在温度(和湿度)的情况下触发的,安全公司会作出反应,就像是入侵一样
    • 一天中有一个电话来接待,检查是什么错误
    • 在办公时间之外,在5分钟之内访问服务器室进行现场访问,并负责尝试和解决问题(如断路器断开),当然还有一个电话列表,开始打电话找人
  2. 监控系统还使用单独的传感器(以及所有单独的服务器和networking设备内部报告的温度)监控温度,并触发正常的监控警报(邮件和电池支持的GSM调制解调器发出testing消息)

为此,我们只使用ActiveExpertsnetworking监视器,企业许可证非常便宜,它做了GSM通知以及自动,脚本响应和行动警报。

如果你是一个业余爱好者,你可以尝试这个,这将是一个有趣的小项目。

拿起一个简单的PLC

在PLC上的一个触点上有一个温度开关,并将其设置为你想要报警的温度。

在PLC的输出触点上,它会到达服务器机房外面的灯光或警铃,以提醒您。

我们把一般的温度传感器连接到我们的安全系统。 所以当出现温度报警时,就像任何其他types的build筑报警(门,窗户等)一样对待。 这样它就与我们的通知安全过程相关联。

我们之所以select这条路线,是因为在关键时刻出现错误或失败的原因更简单。

我们使用NTI公司的Enviromux-Mini来监控我们配线间的散热 。 它的查询能够通过snmp,所以你可以随着时间的推移,但你也可以让它触发陷阱或电子邮件警报,如果超过阈值。 它的小巧,简单,朴素的作品。 它可以扩展到其他环境警报,如湿度,水检测和接触closures。

此外,如果您在房间中使用切换的cdu / pdu,则可以使用热监视器(如Servertech的Sentry CDU)扩展其中的一些。

我在YouTube上find了这个 我一直在使用ITW的产品多年没有任何问题 – 我search环境监视器时做了大量的研究,这些是我发现的最好的价格。 http://www.youtube.com/watch?v=5Brv0vsHIlA&feature=player_embedded