我有两个Nagios(monitorA和monitorB)服务器在不同的数据中心。 在两个我已经configuration相同的WWW主机。 这工作正常,直到有一个Nagios主机和WWW服务器之间的networking问题。 当networking问题发生时,我充斥着关于WWW主机不可用的误报。 问题 – 是否有解决某种分布式监测? 例如,如果监视器A和WWW服务器之间存在networking问题,则通知将不会被发送,直到监视器B上出现同样的问题? 在此先感谢您的帮助。
Zoredache说什么; 我同意这不是一个真正的假阳性。
你有父母主机吗? 如果是这样的话,Nagios可以检测到down和unreachable之间的区别,你可以决定如何处理不可达vs. down。 http://nagios.sourceforge.net/docs/3_0/networkreachability.html
如果您的网站无法通过该networking访问,这听起来不像是误报。 但是,如果没有以有用的方式设置依赖关系/通知设置,则可能会收到无用的通知。
你可以设置一个检查,以确认networking链接是好的,在Nagios实例和您的网站托pipe的networking之间? 然后设置您的依赖关系和通知,以便通知您,nagios系统和这个问题之间的联系是问题吗?
如果您正在监控正确的事情,那么您的nagios系统应该告诉您,Internet连接在某个数据中心发生故障,而不是由于networking连接断开而通知您无法访问的所有服务。