Articles of Nagios

Centreon / Nagios check_http:使用不同的域名/url

我将Centreon CESconfiguration为监控系统 – 现在我面临以下问题: 有一个域名为example.com的主机,其parsing为123.123.123.123 。 该主机不是由我configuration的,如果用户访问http://example.com ,则显示内容,如果用户访问http://123.123.123.123 ,则显示404 。 那么,现在Centreon显示WARNING ,当然,因为给定的域名parsing到IP – 这将返回404 。 现在我试图修改check_http命令如下: $USER1$/check_http -H $HOSTADDRESS$ $ARG1$ 作为我试图给的论据 ARG1 => -u www.example.com 我认为这个系统将它结合起来 $USER1$/check_http -H $HOSTADDRESS$ -u www.example.com 但事实并非如此。 什么才是正确的方法来获得我想要的结果?

nrpe用户不能正确执行脚本使用lsof远程执行,netstat工程

我为nagios创build了一个简单的脚本来检查远程服务器上的端口。 本来我试图用lsof 。 #!/bin/bash RESULT=$(lsof -i :8080 | grep LISTEN) if [ -n "$RESULT" ] then echo "$RESULT" exit 0 else echo "Check application port is down" exit 2 fi 在本地机器上,nagios用户可以运行并执行脚本并获得预期的输出。 但远程使用check_nrpe ,我总是得到其他的回声 Check application port is down 即使正如我所说的在本地运行脚本,它正常工作 nrpe用户拥有执行该脚本所需的所有权限,SELinux处于宽容模式,但是我永远无法使其工作。 所以我改变了RESULT行来使用netstat 。 RESULT=$(netstat -anp | grep ":8080" | grep LISTEN) 然后我可以使用check_nrpe远程获得预期的响应。 所以我认为这是check_nrpe和lsof的问题。 但我永远无法在日志中find任何东西。 任何人有任何想法或build议,以使这与lsof正确工作?

Nagios:禁止发送特定主机的通知

我们有我们的服务器的Nagios,但只是其中一些我们想发送通知。 我认为,如果我为特定的主机设置notifications_enabled to 0 ,这不会再发生。 define host{ use linux-server host_name dev1 alias dev1 Server address 100.100.100.205 notifications_enabled 0 } 但是,这被忽略了。 在nagios.cfg中 , enable_notifications=0是可行的 ,但是我们需要更好地调整它。 根据一些材料, use_retained_program_state=0应该做的伎俩,但它似乎没有效果。 感谢帮助。

确认/忽略X min / hrs / days的nagios警报?

我有一个正确注意到问题的Nagios服务。 我正在那台机器上运行一个命令来解决这个问题。 然而,这将需要几个小时的运行。 在此之前,Nagios仍然(正确)将其检测为问题。 我可以“承认”这个问题,我不会再收到通知,但是如果我的清理命令有问题,除非我记得重新检查,否则我不会知道这个问题。 是否有一定的时间“承认”一个nagios问题? 在那之后,如果还是有问题的话,按照常规发送一个nagios警报? sorting“忽略这个问题的下一个X分钟/小时/天”? 一个nagios问题的“打盹”button?

监视Windows服务 – Nagios

在Nagios中,如何监视在不同用户帐户下运行的Windows服务,而不是在本地系统帐户(以login身份)下运行? 提前致谢。

我可以使用什么监视代理将NSClient ++ nagios代理程序加载到HyperV服务器上

所以我已经安装了我的新hyperv服务器,有几个虚拟机运行良好 – 现在我意识到我没有办法挂接主机服务器到我的nagios(核心),监视我的环境的其余部分。 是否有替代NSClient ++(或一些开关或东西),我可以用来从主机拉动nagios信息? 我试过了: 在hyperv框中的小命令窗口中下载并安装msi软件包。 下载是好的,但它不承认.msi文件,说32位和64位都是无效的 This installation package could not be opened.Verify that the package exists, and that you can access it, or contact the application vendor to verify that this is a valid Windows Installer package. 通读这篇文章 – 虽然它假设一个完整的Windows服务器在最后可用: http : //www.altaro.com/hyper-v/how-to-monitor-hyper-v/

NRPE守护进程将:: 1转换为52.0.0.0/14子网

我在debugging模式下configuration了NRPE守护进程( /usr/local/nagios/etc/nrpe.cfg ),因为有一些启动问题,我意识到在allowed_hosts指令中默认发现::1 : allowed_hosts=127.0.0.1,::1,10.252.1.134 神奇地变成52.0.0.0/14根据日志: Sep 6 08:56:44 myhost nrpe[30830]: Warning: Cannot open log file '/usr/local/nagios/var/nrpe.log' for writing Sep 6 08:56:44 myhost nrpe[30830]: parse_allowed_hosts: parsing the allowed host string >127.0.0.1,::1,10.252.1.134< to add to ACL list Sep 6 08:56:44 myhost nrpe[30830]: add_ipv4_to_acl: checking ip-address >127.0.0.1< Sep 6 08:56:44 myhost nrpe[30830]: add_ipv4_to_acl: ip-address >127.0.0.1< correct, adding. […]

用于基于Windows的系统监视的NSClient ++的替代方法

首先,我充分意识到这个问题的存在。 这样一来,我正在寻找一些东西来监视基于窗口的系统的指标,这是不切实际的通过snmp收集(如在日志文件中存在某些子string)。 我尝试过使用NSClient ++,但是它的logging却极其欠缺(即使作者也承认),所以做一些甚至是远程的非标准的纯粹的反复试验,在即将到来的生产环境中是不可接受的。 最重要的是,插件CheckDisk.dll被认为是在最新的“稳定”版本(0.3.6?)中被打破,并报告CheckFile2testing结果不正确。 我真的失去了希望,但是,也许我错过了什么? 也许在那里有一个NSClient ++的替代scheme? 最好有一个全面的文件。 无论哪种方式, 你通过nagios监视基于Windows的主机是什么?

Nagios中是否有一个允许内存之间检查的function?

有很多情况下,我想用Nagios来监视这些值,我不关心这个值本身,而是如何比较以前的值。 例如,我写了一个来检查OpenVZ中的失败计数器。 在这种情况下,我并不在意这个价值,而是我关心价值是否增加。 另一个例子可能是交换机端口,我最想知道一个端口状态的变化(虽然也许这个陷阱会更好)。 对于我的OpenVZ脚本,我使用了一个临时文件,但是我想知道是否有更好的方法? 也许Nagios有一些variables,插件(检查脚本)可以访问持久性检查吗?

Nagios孤儿服务警告

我们已经在我们的一台服务器上运行了Nagios,但一段时间没有出现任何问题,但最近某些旧的服务警告已经重新出现,然后在服务详细信息页面上消失。 从查看日志,我发现像下面这样的警告。 警告:主机'virtual1'上的服务'Tomcat'的检查看起来像是孤立的(结果永远不会回来)。 我正在计划立即检查服务… 有没有人遇到过这个或至less知道一种方法来删除旧的孤儿警告。 我们正在运行的Nagios版本是版本3.0b7,所以更新可能是按顺序的。 谢谢。