我们有服务通过监听心跳监视我们的服务器场,并在服务器没有响应时发送电子邮件通知。 当发生这种情况时,我们中的一个人将ssh并重新启动服务器。
我觉得必须有一些软件工具来自动执行这个手动重启,最好是开源工具。 如果是这样,你可以build议一些吗?
SSH可以做你想做的事情(通过无密码键login,远程命令重新启动机器)。
如果你需要这样的工具,你会遇到更严重的问题 – 你应该研究为什么这些机器需要重新启动并解决这个问题。
类似于voretaq所说的,你应该仔细研究重启的根本原因,但是大多数监控系统都允许你根据操作执行本地脚本。 我只是简单地创build一个shell脚本,然后发出'shutdown -r now'来重新启动这个盒子。 你也可以包含一个定时倒计时而不是“现在”。
您应该通过在/etc/init.d或“service [servicename] start”中运行相应的脚本来重新启动未能响应的服务,而不是通过重新启动整个服务器。