CPU,主板,硬盘,风扇温度等通过任何硬件Nagios监视

我正在使用NagiosXI,我想监视其他主机的硬盘,CPU温度,风扇速度等

任何人都可以告诉通过NagiosXI进行监控的方式。

我正在使用SNMP方法。 但是没有成功。

我检查了名为check_ipmi_sensor的插件,但没有成功。

答案的详细答案超出了SF答案的范围,但我似乎有理由给你一些指示。 解决scheme分为两部分:

  1. 什么插件在远程机器上运行,
  2. 如何在远程机器上运行它。

2)很简单:它是NRPE ,或者可能通过ssh( check_by_ssh )远程执行,也可能是SNMP(尽pipe我不赞成)。

1)是一个难点,在你破解之前(1),这是不值得的(2)。 这涉及到在远程计算机上查找这些参数的方法,而传感器是一个非常棘手的,依赖于BIOS的,标准无法识别的文档不佳的工作区域。

因此,首先find一个简单的命令,在每台机器上运行,以访问您要测量的硬件参数; 这可能需要在每个不同的硬件平台上使用不同的工具。 然后将其包装在NAGIOS插件逻辑中。 然后通过NRPE调用它。

编辑 :有任何数量的NRPE HOWTOs在那里; 这个对我来说很不错 但是我会重复一下我的警告,直到你有命令来查询你的硬件是否准备好运行,并且用NAGIOS友好的包装器包装,没有任何真正的意义。

如果你要去IPMI路线:最后,大多数插件会调用“ipmitool sdr”并parsing输出。 确保用户nrpe以适当的权限运行插件。 确保ipmi_si和ipmi_devintf模块已加载。 不要忘记,并非所有的硬件都支持IPMI。

如果使用任何旧的,特定于硬件的lm_sensors风格的驱动程序,彻底检查系统稳定性是否会受到影响,其中一些会以令人吃惊的方式混淆低级别的东西。

您可以从一些服务器销售商提供的实用程序中提取大量信息。 我曾经通过戴尔OpenManage实用程序监控了服务器机房温度,该实用程序具有CPU所见的环境温度。

参加NCSA路线或其他被动testing是值得花时间和精力的。 被动路由意味着,如果您的系统build立在主动收集服务器可以提供的东西之上,那么被动testing可以被收集并发送到主服务器。 此外,如果您的Nagios服务器遭到入侵,入侵者可以在连接到Nagios服务器的任何服务器上运行程序。 使用被动路由(以及对NCSAstream量进行encryption),您可以将testing结果“发送”到Nagios服务器…并且如果Nagios服务器被入侵…那么入侵者仍然无法访问Nagios框。 而且,对于被动(NCSA),您可以在交换机中放入ACL,只允许stream量从TESTED服务器发送到Nagios服务器,同时阻止从Nagios服务器到TESTED服务器的stream量(希望是有道理的)。