监控多个linux服务器并自动恢复服务或重启

可能重复:
你用什么工具来监视你的服务器?

我想监视大约30-50台服务器。 这包括:

  • MySQL正在运行?
  • Apache2正在运行?
  • 平多高?

如果任何服务失败(不能ping,MySQLclosures,…),我想收到一封电子邮件,详细的状态报告。

我很想看到一个漂亮的网页界面:)

更进一步:我希望系统尝试重新启动服务器(目前,当服务器出现故障时,我必须手动重启)。

这是可能的,如果是的话,怎么样?

空间中有几个工具。 取决于你的问题有多复杂,你想学多less将决定解决scheme。 Nagios被@Matteo提及。 这是一个非常好的工具,跨平台,非常强大,在configuration方面有点复杂。

ZenOSS据说更容易configuration。

Monit的重量更轻,能够处理您的任务。 三者都有能力通知和采取补救措施。

Nagios是一个选项。 它有许多插件来检查进程,networking,…它有一个网页界面,你可以定义,除了通知还要执行的行动。

另一个可能的解决scheme是Zabbix – 它具有许多function,可以通过基于Web的前端完全pipe理,比Nagios更易于configuration。 而且,它可以运行远程命令,因此在发生故障时重新启动服务(或整个服务器)将会非常容易。