我们在办公室使用的Nagios系统出现了一些问题,这个系统最近刚刚开始出现。
我真正想知道的是解决这个问题的最好的解决scheme,因为我做了一些阅读,似乎有很多不同的方式来解决这个问题。
基本上在随机点和随机的主机/服务,我们将得到一个严重的警告标志着一些事情是不应该的,当我们调查9次10出我们结束这是一个错误信息。
"SERVICE ALERT: SERVERNAME ;NSClient++ Version;CRITICAL;SOFT;1;CRITICAL - Socket timeout after 10 seconds"
表明服务或主机已超时,我该如何设置超时停止? 我读过一些插件超时只有10秒钟…
谢谢克里斯
通常,对于任何服务,如果服务器太忙而无法响应,则会得到这些服务。在networking中等待。您可能会尝试查看服务器是否处于负载不足的状态。
我认为你想要看的主要是与服务或服务模板相关的max_check_attempts指令,所以在连续几次检查进入失败/严重状态之前,你不会得到警报。 您还可以使用-t开关将check_nt插件的超时值调整为:
-t, --timeout=INTEGER Seconds before connection attempt times out (default: 10)
我还build议检查受监视的主机上的NSClient。