Megacli检查返回“确定; NRPE:无法读取输出”

有一个icinga服务器设置运行check_megaraid_sas 。 在过去的7个月里,它一直在美丽地工作。

在这段时间内,有几个“无法读取输出”的信息出现了各种原因,在所有这些情况下,状态是未知的,这触发了我们的警报系统。

最近的驱动器从警告,到关键,以确定:

  • 15:22:03 RAID-Health; WARNING; …
  • 18:42:03 RAID-Health; CRITICAL; …
  • 19:04:03 RAID-Health; OK; NRPE:无法读取输出

在这个问题的时候,megaraidsas状态返回了以下内容:

-- Arrays informations -- -- ID | Type | Size | Status -- Disks informations -- ID | Model | Status | Warnings 

然而,我本来希望脚本能够返回“OK:Drives 0”(正如一些用户的评论所暗示的那样 – 仍然是一个错误,而是一种不同的解决方法)。 由于NRPE返回“无法读取输出”并将其标记为“OK”,这使得我认为这是NRPE而不是脚本的问题。

有没有什么办法可以说服NRPE,当它没有收到任何数据作为支票的回应,检查失败? 还是有其他人有什么想法,可能发生了什么?

正在检查的服务器已重新启动,我不确定是否会再次显示该情况以进行testing。

这通常意味着检查返回的结果(例如与输出交错的错误消息)违反了nagios检查输出的格式。 su – 监视插件在远程服务器上运行,并检查输出; 如果看起来确实pipe它到hexdump -C,因为意外的控制字符可以混淆nrpe。