检查服务器是否存在,如果不是

可能重复:
你用什么工具来监视你的服务器?

我正在寻找服务器群的监控解决scheme。 它应该解决以下问题:

  1. 检测主机是否发生故障或活动,并尽可能检测主机是否真正发生故障,或者是否由于networking故障而无法访问主机

  2. 如果主机发生故障,请运行一个脚本(除了在服务器场中的其他主机上运行一些命令)

虽然听起来像你想要做的事情会被Nagios覆盖,正如SvenW所说,鉴于你的标签包括“高可用性”和“集群”,你可能想要看看Pacemaker ,这是一个function齐全,非常一个复杂的集群和高可用性解决scheme,可以做任何事情(一旦你了解如何)。

Nagios做你想要的。 networking故障可以由依赖系统处理,由事件基础设施在其他主机上处理。