Nagios多重检查尝试硬确定

寻找一个configuration选项,使得以OK响应的检查不会达到硬状态,直到达到max_check_attempts。

问题是,我们将有一个服务,我们可以在网上,然后几分钟后马上回落,但当它回来了,它发出了OK通知,这就closures了我们的票务系统的问题。

我的build议是首先确定在投影机停电之后的多长时间内,在考虑停电之前可以接受一个新的停电,而不是最后停电的一部分。

根据这个窗口是多less,我会说遵循@ b0fh的build议,并重新devise检查。 如果窗口很短(几分钟),只要告诉OK结果睡眠X分钟,然后重新运行检查; 如果它通过第二次然后发送退出代码0.但是,如果窗口更长,那么几分钟,我会说一个更好的select是重新devise检查本质上与状态caching(以便您可以比较一个停机/设备对高速caching)。 为了使这种方法更加有效,您可能需要将脚本/检查作为Nagios主机上的预定作业运行,并将被动检查结果发送给Nagios。

Nagios认为您所描述的主机或服务是以拍打方式进行操作的。 您可能希望调整此主机/服务的振膜检测。

使用check_command来覆盖默认的主机检查,并定义一个自定义的检查/脚本,在声明状态之前将执行所需的检查次数。 更容易,再次使用check_command,定义一个新的check-host-alive,在声明主机closures之前有多个ping。 默认是一个ping。