Articles of Nagios

请帮助将pnp4nagios与icinga-web集成

有没有人曾经把pnp4nagios与icinga-web整合起来? 我的icing-web版本是1.8.1 安装icinga-web-pnp后,我有以下文件: PNP宿主的extension.xml PNP-服务的extension.xml 在这个位置: /usr/share/icinga-web/app/modules/Cronks/data/xml/extensions 在控制台中我没有看到默认列perfdata? 我错过了什么吗? 在主机对象定义中,process_perf_data也被设置为1。

Ubuntu 12.04上的Nagios NRPE“无法读取输出”

正确的点。 NRPE.CFG修改: 添加Nagios主机允许: allowed_hosts = 127.0.0.1,192.168.1.10 在command_prefix=/usr/bin/sudo前删除了# 之后,我已经重新加载服务。 /etc/init.d/nagios-nrpe-server重新启动 我也编辑过/etc/sudoers #用户权限规范 根ALL =(ALL:ALL)ALL nagios ALL = NOPASSWD:/ usr / lib / nagios / plugins / 运行: $ ./check_users -w 5 -c 10 用户行 – 1个用户当前login|用户= 1; 5; 10; 0 作品,我得到我的结果 运行: su nagios -c“./check_users -c 2 -w 2” 没有任何解决办法。 从Nagios主机到新的远程系统,我可以运行: check_nrpe -H 192.168.1.20 结果我得到了NPRE v2.12 […]

NSClient ++:无效的返回码-1073741502

我遇到了NSClient ++(版本0.3.8.76)的问题。 我设置了一个外部脚本处理程序,它正在工作。 但是,自从有一段时间它返回这个,每次我运行检查: No output available from command (cmd /c echo scripts\scriptname.ps1; exit($lastexitcode) | powershell.exe -command -). 它在半夜停止工作,没有任何交互。 在NSClient ++日志的外观显示: error:modules\CheckExternalScripts\CheckExternalScripts.cpp:188: The command (cmd) returned an invalid return code: -1073741502 从那以后,这发生在我尝试运行的每一个脚本。 似乎没有任何工作了。 重新启动NSClient服务没有帮助,但是当我用/ test标志运行nsclient时,它按预期工作。 因为这台机器有一些生产性的服务在运行,所以重启很困难。 NSC.ini似乎没有问题,因为它没有改变,因为它工作,相同的configuration也用于不同的主机和工作。 此外,nsclient ++。exe / test的工作原理应该如此。 我感谢任何帮助或提示如何解决这个问题。 TIA!

Nagios是否可以configuration为定期重新发送恢复通知?

我有一个能够集中监控Nagios多种客户环境的环境。 这里的想法不是要完全pipe理这些环境,而是让环境在很大程度上是自治的,并且作为无法直接解决的问题的升级途径。 我发现使用NSCA作为通知方法比使用强迫命令的更常见的分布式监视系统具有一些优点。 也就是说,我可以使用Nagios中的通知逻辑来configuration哪些问题升级,以及在什么情况下。 例如,客户可以在涉及到问题之前就承认问题,而基于强迫性的分布式configuration是不可能的。 问题是当通知丢失时,这两个实例可能会失去同步。 对于失败的服务,这可以通过服务升级轻松解决; 如果没有收到故障通知,另一个将很快发送。 但是,在我看来,无论升级设置如何,恢复通知都不会重新发送。 因此,如果中心位置收到故障通知但错过了恢复通知,则两个位置将永远保持不同步。 如果我可以在某个时间间隔内重新发送OK状态的通知,即使没有变化,这个解决scheme也是理想的,但是我看不出有什么办法。 否则,我还没有考虑其他解决scheme?

nagios不发送通知邮件

Nagios不为我的服务发送通知。 我在nagios localhost中有两个叫做PING和STATUS的服务。 PING服务检查主机可用性使用ping命令和STATUS服务从远程机器获取SNMP陷阱。 有时我收到电子邮件PING服务,但状态服务没有得到任何邮件。 PING服务也不总是发送邮件。 在我所有的configuration文件下面。 localhost.cfg define host{ use linux-server host_name TESTHOST alias snmp_agent address 10.10.62.5 } define service{ use local-service host_name TESTHOST service_description PING check_command mailtest notifications_enabled 1 } define service{ host_name TESTHOST service_description STATUS is_volatile 1 check_freshness 1 check_command cagent!5 max_check_attempts 4 normal_check_interval 1 retry_check_interval 1 active_checks_enabled 0 passive_checks_enabled 1 check_period […]

用pnp4nagios重新处理所有的nagios数据

我已经转移到新的nagios安装(新的服务器)。 我已经从原始服务器( /var/log/nagios2/archives )将数据传输到我的新服务器( /var/log/nagios3/archives )(我认为它们具有兼容的格式)。 现在我想用这个历史数据重新生成pnp4nagios图。 这是我必须即时处理数据的命令: /usr/lib/pnp4nagios/libexec/process_perfdata.pl –bulk=/var/lib/pnp4nagios/perfdata/host-perfdata 但是这只是处理/var/lib/pnp4nagios/perfdata/host-perfdata新数据。 我有几个问题: pnp4nagios在哪里存储处理的数据(图)? 我怎样才能强制pnp4nagios重新生成所有图?

如何使用Nagios ping检查使用dynamicIP地址?

我目前在监视Nagios / Icinga中使用dynamicIP地址的目标机器的正常运行时遇到问题。 networking正在使用DNS域控制器,Icinga服务器在networking内部的Ubuntu机器上运行。 手动运行“check_ping”命令时出现以下错误: > ./check_ping -H somehost -w 10,1% -c 20,2% check_ping: Invalid hostname/address – somehost 当我运行“平”而不是它的作品: > ping somehost PING somehost.local (192.168.0.206) 56(84) bytes of data. 64 bytes from somehost.local (192.168.0.206): icmp_req=1 ttl=128 time=0.215 ms 如何启用使用dynamicIP的主机监控?

在nagios中dynamic添加新的主机

我有一个监控目录中的xml文件的nagios服务器。 每个XML文件都有唯一的ID,基于ID我创build在configuration文件的帮助下,在NAGOIS服务器的主机。 所以每个XML文件都有主机和相应的服务。 目录中xml文件的数量不固定,在运行时会改变。 那么我怎么可以添加新的主机(主机configuration文件)新添加的XML文件与不同的ID在运行时的目录? 是否有可能从nagios webconsole添加新的主机? 谢谢。

NSCA不接受检查

NSCA似乎注册了连接,就像在syslog中看到的那样,但是对于一个不知道的原因(至less对我来说)并不是把它写到icinga.cmd,或者至less读了它。 这是系统日志。 Jun 27 08:24:58 Mcentral nsca[13720]: Connection from 10.61.34.151 port 23204 Jun 27 08:24:58 Mcentral nsca[13720]: Handling the connection… Jun 27 08:24:58 Mcentral nsca[13720]: End of connection… Jun 27 08:24:59 Mcentral nsca[13721]: Connection from 10.61.34.151 port 23460 Jun 27 08:24:59 Mcentral nsca[13721]: Handling the connection… Jun 27 08:24:59 Mcentral nsca[13721]: End of connection… 这里是我的nsca.cfg […]

.bat文件 – Nagios v3.2服务检查并在停止时启动

我只是几乎没有进入编程,所以我为我的无知道歉。 我正在尝试创build一个.bat文件来检查服务是否在XP专业版上运行。 如果服务正在运行,它将退出0.如果服务停止启动服务等待10秒(通过ping我猜)检查服务正在运行,如果服务正在运行退出0,如果服务停止启动服务等待10秒 这样做总共检查3次。 如果服务在这段时间内没有出现:退出2 退出0 = ok退出1 =退出警告3 =关键(这会提醒) 我需要为3个不同的服务做到这一点,但我期望每个服务创build一个更好。 这样你就会得到通知,不会回来的特定服务。 目标是,如果服务停止将启动它。 如果30秒后无法启动服务,则会发送警报。 我试图用.bat来做这件事的原因是这与所有其他脚本是一致的,我不想通过添加不同types的代码来使其复杂化。 是的一致性! 我再一次道歉,因为我最后一刻被抛到这个项目上的无知。 感谢您的帮助和阅读我的问题!