我们的托pipe提供商为我们提供了APC AP7932交换式0U PDU作为他们提供给我们的几个机柜的一部分。 我们在这些PDU的networkingpipe理方面遇到了很多麻烦,我将在下面介绍。 我们正在转向同一个数据中心的笼式空间,并将购买我们自己的笼子的PDU。 我想从远程pipe理的angular度来确定哪些企业级PDU是可靠的执行者,这样我们就不会在纸上购买看起来不错的东西,而是一个噩梦。
我们的colo提供的PDU被configuration为支持通过SSL Web UI和telnet进行pipe理。 我们将所有的固件升级到了2011年11月的当前版本。 他们可靠地回应ping,我们没有理由怀疑networking层的问题。 但是,我们经常在所有PDU中经历挂起,超时,断开连接和embedded式pipe理主机的普遍不可用性。 我们偶尔需要重新启动PDU上的微控制器才能恢复偶尔出现的硬故障。 网点保持供电(幸好),但pipe理方面是不可靠的,它已经成为一个操作责任 – 我们不能确定,如果我们需要,我们可以进入PDU重新启动主机。 我们有3个PDU都performance出相同的行为。
有许多企业级0U交换式PDU的制造商,都具有可比较的特性。 如果我查看目前的PDU的数据表,他们似乎是一个很好的select – 只有通过使用它们的痛苦的好处,我们知道要避免它们。 我想避免select在纸上看起来不错的PDU,但是具有类似的可靠性问题。
开关PDU的经验是什么? 这种片状水平是否正常?
你描述的是不正常的。 但是,您如何确定可用性? 你有一个监测解决scheme不断ping /探测设备?
在过去,我曾经从我的APC UPS和PDU设备收集OpenNMS 。 一些检查,特别是http,ftp和telnet探测,导致pipe理界面超时,造成30-60秒中断。 也许这就是你所看到的。
但是,我从来没有收集SNMP的问题。 所以如果是这样的话,尽量减less对pipe理界面的命中,只关注收集你需要的东西。
从我的OpenNMS可用性图在APC界面摘录 