有一个icinga服务器设置运行check_megaraid_sas 。 在过去的7个月里,它一直在美丽地工作。
在这段时间内,有几个“无法读取输出”的信息出现了各种原因,在所有这些情况下,状态是未知的,这触发了我们的警报系统。
最近的驱动器从警告,到关键,以确定:
在这个问题的时候,megaraidsas状态返回了以下内容:
-- Arrays informations -- -- ID | Type | Size | Status -- Disks informations -- ID | Model | Status | Warnings
然而,我本来希望脚本能够返回“OK:Drives 0”(正如一些用户的评论所暗示的那样 – 仍然是一个错误,而是一种不同的解决方法)。 由于NRPE返回“无法读取输出”并将其标记为“OK”,这使得我认为这是NRPE而不是脚本的问题。
有没有什么办法可以说服NRPE,当它没有收到任何数据作为支票的回应,检查失败? 还是有其他人有什么想法,可能发生了什么?
正在检查的服务器已重新启动,我不确定是否会再次显示该情况以进行testing。
这通常意味着检查返回的结果(例如与输出交错的错误消息)违反了nagios检查输出的格式。 su – 监视插件在远程服务器上运行,并检查输出; 如果看起来确实pipe它到hexdump -C,因为意外的控制字符可以混淆nrpe。