我正在寻找一个设备/软件/机制,通过这个设备/软件/机制,我可以按一个button,数据中心中的所有服务器都将打开。 但是服务器需要按照特定的顺序打开,如果发生故障,需要通知系统pipe理员。
有任何想法吗?
一些APC的PDU具有可configuration的功率延迟。 用APC的话来说 …
允许用户configuration为每个sockets打开或closures电源的顺序。 这有助于避免在启动时发生涌入,从而导致电路过载和负载下降。 sorting还允许用户预先确定哪个设备首先打开,所以依赖于该设备的其他设备将正常工作。
这听起来可能会满足你的需求。
最简单的情况:所有服务器都对Wake on LAN起反应。 以期望的顺序唤醒他们,并检查他们是否还活着Nagios或类似的东西。
如果这不起作用,则需要为每台服务器(即APC)至less配备一个出口的networkingPDU。 然后,您可以从上面更换WOL部件,并按所需顺序打开sockets。 这可能适用于SNMP或特定于供应商的东西。
在最近的服务器硬件上,您可以将系统设置为自动开机。 另外,您可以configuration一个设定的或随机的开机延迟(以避免电路过载)。 这通常是BIOS设置,但可以帮助恢复特定顺序的权力。
除此之外,我总是会推荐一个开关式PDU (配电单元)用于共置设施的部署。 使用其中一个,您可以对电源应用程序进行细粒度控制,并监控/测量各个电源端口。 这可以绑定到您的监控系统。
你有一些可能性。
通过脚本唤醒Lan,可以在服务器正确重新启动时收到通知。
几乎每个最近的服务器都有接口,允许您远程连接到服务器来pipe理BIOS,引导选项和远程启动。 惠普是国际劳工组织:
http://h18013.www1.hp.com/products/servers/management/remotemgmt.html
我们目前有一个使用Zabbix的设置。 我们将它configuration为在交换机,服务器,打印机脱机时发送电子邮件。 我们也监测我们的UPS发送关机命令在我们所有的服务器,esxi,虚拟机,交换机,pipe理控制台,路由器等功率水平过低后,电源故障。
然后,我们configuration这个zabbix按照我们想要的顺序启动服务器。 当服务器没有正确重启时,我们可以得到通知。
花了一些工作,但是值得。
消防部门,也许。 我不确定是不是一个好主意,用这么多系统一下子开动你的电网,但我不是电工。
至less,我不知道我是否相信自动系统来做这样的事情。