Nagios“CRITICAL – 套接字在10秒后超时”服务和主机问题检查

我们在办公室使用的Nagios系统出现了一些问题,这个系统最近刚刚开始出现。

我真正想知道的是解决这个问题的最好的解决scheme,因为我做了一些阅读,似乎有很多不同的方式来解决这个问题。

基本上在随机点和随机的主机/服务,我们将得到一个严重的警告标志着一些事情是不应该的,当我们调查9次10出我们结束这是一个错误信息。

"SERVICE ALERT: SERVERNAME ;NSClient++ Version;CRITICAL;SOFT;1;CRITICAL - Socket timeout after 10 seconds" 

表明服务或主机已超时,我该如何设置超时停止? 我读过一些插件超时只有10秒钟…

谢谢克里斯

通常,对于任何服务,如果服务器太忙而无法响应,则会得到这些服务。在networking中等待。您可能会尝试查看服务器是否处于负载不足的状态。

我认为你想要看的主要是与服务或服务模板相关的max_check_attempts指令,所以在连续几次检查进入失败/严重状态之前,你不会得到警报。 您还可以使用-t开关将check_nt插件的超时值调整为:

 -t, --timeout=INTEGER Seconds before connection attempt times out (default: 10) 

我还build议检查受监视的主机上的NSClient。