如果主机失去连通性,则会提醒nagios警报

我们使用nagios监视我们的服务器场,通常它工作得很好。 不过,有时候nagios运行的主机会丢失几分钟的连接,这使得nagios相信它所监视的所有服务器和服务都是closures的。 其结果是数百个警报邮件,紧接着是数百个恢复邮件。

有没有什么办法可以configurationnagios,让它在发布雪崩警报邮件之前testing自己的连接?

是的,你可以设置父母和孩子。 如果父母closures,则不会通知孩子。 您需要正确设置时间(在generic_service和generic_host或您使用的任何模板中),因为当服务不再可用时,需要确定父服务器已closures,然后才会将通知发送给这些服务。

我做的是这样的:

# ISP gateway (first in traceroute) define host { host_name kpn-gateway alias KPN Gateway address 1.2.3.4 use generic-host notification_period never parents experia } # gateway in datacenter define host { host_name duocast-gateway alias Duocast gateway address 5.6.7.8 use generic-host parents kpn-gateway contact_groups bla } # one of the hosts in datacenter. define host { host_name brick alias host.example.com address abcd use generic-linux-host parents duocast-gateway contact_groups geborsteldstaal }