拍打UNKNOWN Nagios状态的原因是什么?

我们通过OpsView运行一些Nagios服务检查,我们的主机之一得到了一个奇怪的SSH响应:

“未知:服务结果陈旧”

它经常发生,但似乎随着系统第二次和第三次重试而消失。 它在上个星期的补丁和重启服务器之后开始。 系统本身响应从我testing过的盒子(这不包括监视系统,我不给予访问)的SSH。

/ var / log / secure充满了行ala:

sshd[15628]: Did not receive identification string from xxx.xxx.226.20

时间戳是每五分钟可靠的,这很明显是监控脚本一旦得到login提示就断开连接。

任何人都知道可能是什么原因造成的,或者如何解决? 看到这个popup和closures状态页面真的令人沮丧。

“没有收到标识string”就是在有人连接的情况下从sshd得到的信息,然后断开连接而不尝试SSH握手(这是Nagios SSH检查的作用) – 所以没有什么可担心的。

现在,至于为什么你会得到“陈旧的结果”,看起来好像你正在使用被动检查,这不是我的SSH检查的首选。 然而,也许OpsView整合要求…无论如何,过早陈旧的检查结果意味着你不会发送被动的检查结果往往足够Nagios的喜好,所以无论你需要告诉什么是喂养的检查结果做到这一点或者告诉Nagios对检查结果的频率要less一些(将freshness_threshold设置为大于它的值),或者如果还没有定义,则大于300(秒;如此5分钟)。 。