我有nagios和nrpe运行,但我自己configuration它相对较新。
有没有办法得到检查的原始数字,而不是只是好/不好吗?
例如,如果我想通过运行几个小时的进程来监视主机的内存使用情况,并查看它是如何波动的,那么nagios可以这样做,还是只能告诉我它是否跳过某个阈值?
我相信你要找的是一个RRDtool为你收集数据。 我使用的是Nagios的扩展集合check_mk ,但还有很多其他选项。
一般来说,nagios通知你好/不好。 我认为可以肯定地说,大多数人使用nagios让他们知道在他们的环境中是否有奇怪的事情发生。 它确实显示了当前状态的数字,但这听起来不像你所要求的。
我之前已经从nagios.log中清除了值。 这不是很好,但它是可行的,如果这是一个一枪,可能是你最好的select。 (例如:我曾经被要求撤销Exchange在一段时间内全部存储的历史。)
如果你一直在寻找nagios来检查波动,你可能会写一些npre的自定义脚本来运行,定义好/不好,因为“波动太大”。
我希望有帮助。
nagios有各种RRD(一种专用于收集这种时间数据的数据库)附件。
然而,对于这种性能监控来说,nagios是一个糟糕的select。 它实际上作为一个警报系统function最好,大多数网站使用其他像神经节或仙人掌进行性能跟踪。
Nagios是烟雾报警器,神经节是温度计。
每个检查中都有第三个字段,您可以放入任何types的数据,但是需要searchnagios.log文件。
Nagios最适合监控服务,以确保在服务/盒子停机时收到通知。 如果资源价值超过了阈值,我会build议使用graphics化系统资源的munin,munin也具有提醒function。 我正在使用munin(作为辅助监控工具)和Amazon SNS来获取警报。
Nagios基本上是一个警报系统,正如其他人所说的那样,即没有embedded历史报告系统。
但是有很多插件可以为你做这个工作。 我相信NagiosGraph是最常见的,安装和使用都很简单。

您可以每日,每周,每月和每年查看度量标准,也可以通过操作度量标准映射(nagiosgraph映射文件)为插件创build自己的graphics。
可以这么说,Nagios对于返回的实际数据没有任何影响, 您可以使用挂接到Nagios的插件来处理数据。 绘制此perfdata的更受欢迎的插件之一是pnp4nagios 。 它与Web用户界面完美集成,易于设置,并且也被封装在几个Linux发行版中。
有关其他选项,请参阅Nagios Exchange 上的graphics/趋势附加类别 。