在Nagios 3中,我想要一个服务在关键XX分钟后升级。 它对于从UP到CRITICAL的服务非常有效。 但是,如果服务已经超过了XX分钟(对于缓慢上升的磁盘空间),并且变得至关重要,那么第一个失败就是触发升级。 它正在计数警报升级计数,因为我们希望它在3个CRITICAL警报之后失败,而不是3个警告和一个关键警报。
有没有一个解决scheme,可以让我忽略警告从计数到服务检查升级?
以下是另一个具有相同问题的用户的示例 – 以及非常相似的configuration。 http://copilotco.com/mail-archives/nagios-users.2009/msg00310.html )
因为我不使用在我的Nagios实现中的升级,所以我会盲目地讲,只是关于Service Escalation定义的文档 。
你可能不得不考虑first_notification指令:
first_notification:该指令是标识此升级有效的第一个通知的数字。 例如,如果将此值设置为3,则只有在服务处于非正常状态足够长时间才能使第三个通知熄灭时,才会使用此升级。
还要考虑escalation_options指令:
escalation_options:该指令用于定义确定何时使用此服务升级的标准。 升级仅在服务处于本指令中指定的状态之一时使用。 如果在服务升级中未指定此指令,则升级在所有服务状态期间均被视为有效。 有效选项是以下一项或多项的组合:r =在OK(恢复)状态下升级,w =在WARNING状态下升级,u =在UNKNOWN状态下升级,c =在CRITICAL状态下升级。 示例:如果在此字段中指定w,则只有在服务处于警告状态时才会使用升级。
所以,要达到你想要的(3 CRITICAL报警之后升级),我会尝试像这样的定义:
define serviceescalation{ host_name myhost service_description Disk Usage first_notification 3 last_notification 0 notification_interval 10 contact_groups admins escalation_options c,r }
希望它会有所帮助…并且工作…!