延迟munin通知

我有一些由munin监视的服务器,相当频繁的select单元之一有一个短暂的读取数据失败。 这给我两封电子邮件,一封告诉我,所有的价值都是未知的,第二个五分钟后,让我知道一切都好。

据我所知,munin按照这里devise的那样运行,但是我想知道是否有任何方法可以延迟在一个更新周期内发送初始的“未知”警报,所以不报告瞬时未知事件? 我现在所有的设置都是训练我忽略警告邮件。

否则,有什么办法可以禁用发送“未知”的警报及其相应的恢复警报?

我没有真正使用Munin,但是因为我看到unknown_limit设置可以被设置为项目/插件,它定义了在将值设置为“未知”之前应该发生多less连续的不成功的读数。

基于Munin :: LimitsOld模块默认为3,我想你应该尝试设置或增加这个数字。

我在Munin 1.4.5上查过这个。

我通过让munin通知,而不是直接告知最终用户,而是通过NSCA将其告知NAGIOS,并让NAGIOS处理通知。 这意味着我可以使用NAGIOS(更复杂)控制通知延迟,频率,升级等。 是的,NAGIOS非常重量级,只是作为一个通知引擎,但是你可以使用它来进行质量(而不是定量)的监控。

请记住,使用开源工具最大的好处之一就是可以查看源代码,看看它们究竟是干什么的(如果不喜欢,就改变行为)。 LimitsOld.pm的快速扫描表明,Gábor的build议是正确的方法 – unknown_limit可以设置为每个服务或全球范围内,并出现在慕尼黑1.4.4周围(见http://munin-monitoring.org/ticket/828 )。