Articles of Nagios

防止某些主机的nagios检查

有没有办法configuration一个特定的检查,以防止它在该主机组的某些主机上运行? 我希望检查不要在主机组的所有主机上运行。

Nagios检查Windows Server 2008+上的wuauserv

从Windows Server 2008+起,wuauserv不再是一直运行的服务,而是作为计划任务运行。 我不确定如何创build计划任务的确切行为,因为看起来计划是由另一个服务生成和编辑的。 在此之前,我们设置nagios只是检查正在运行的服务,以确保它接受更新。 我的问题是,如何利用nagios追踪Windows Server 2008+中的wuauserv服务的正确执行/运行,以确保它接受更新?

Nagios check_procs状态filter

我在Ubuntu 14.04上试图运行 /usr/lib/nagios/plugins/check_procs -C rsyslogd -w 1:3 -c 1:5 -s S 并返回 PROCS CRITICAL: 0 processes with command name 'rsyslogd', STATE = S | procs=0;1:3;1:5;0; 所以我使用-vvv运行,并发现-vvv使用命令/bin/ps axwwo 'stat uid pid ppid vsz rss pcpu etime comm args'来列出进程。 我find我的rsyslogd进程,它列出如下: Ssl 101 406 1 256232 25392 0.0 157-05:57:14 rsyslogd rsyslogdproc#=0 uid=101 vsz=256232 rss=25392 pid=406 ppid=1 pcpu=0.00 stat=Ssl […]

简单检查一下mysql是否与Nagios合作

是否有一个简单的检查,看看是否在没有authentication和select表的Nagios主机上运行?

如何通过Nagios监视日志文件

我可以监控吗? 内核日志消息,apache错误日志,通过nagios的邮件日志消息。 我有三个Linux服务器,我希望在每台服务器上应该有东西,以便我可以从一个位置看到所有日志文件 我是新来的,所以我不知道

使用Nagios 3的NRPE和SNMP的优缺点?

我已经在客户端上使用了NRPE的Nagios 3一段时间了,而且效果很好。 现在我听说,如果我使用SNMP,我不必在每个客户端上安装check_ plugins。 那么有没有人知道NRPE与SNMP的优缺点? 我的监视器服务器是一个CentOS5和Nagios 3,客户端大多是CentOS和Ubuntu。

使用Nagios(或其他免费产品)来监视具有dynamicIP地址的50多台远程机器的正常运行时间

我试图监视53个远程Windows机器的正常运行时间,全部在不同的地点。 这些都是各种制造商廉价的消费级路由器的后面,他们都有dynamic的IP地址。 我只想拥有一个机器列表,如果他们当前连接到互联网,并且他们在最后一次检查时没有连接。 会很好:每个机器的简单日志表明他们离线的时间。 我们是一个非营利组织。 我正在寻找一个开源/免费的解决scheme。 我最初的想法是在每台机器上启动一个隐藏的IRCbot并自动连接到一个通道。 我可以join上述通道,并一目了然地看到哪些机器已连接,通道日志(足够的筛选)会告诉我哪些机器经常断开连接。 一位朋友告诉我:“不用,请使用纳吉奥斯”。 经过一些Googlesearch,我已经到达了我已经安装在远程盒子上的NCclient ++,并试图用我全新的Nagios盒子进行检查,没有多less运气。 我在正确的轨道上? 任何人都可以指向正确的方向吗? 我一直在search一个更全面的指导如何做到这一点,我没有太多的运气。

你如何在NAGIOS中inheritance服务检查?

我们有一个使用inheritance的nagios设置比我以前更大的程度。 我已经阅读了文档: http://nagios.sourceforge.net/docs/3_0/objectinheritance.html 但是我仍然无法理解如何实现我的目标。 我有通知过程警告的服务器/主机。 我调查了这一点,这是一个已知的错误,并安全地忽略这个特定的服务器。 理想情况下,我想增加这个主机的服务定义的警告/关键点; 但我也很舒服,只是没有使用此服务检查,直到当前问题的补丁发出。 禁用通过networking界面是不是我的pipe理者可以接受的select。 服务定义: define service{ use unix-agent-service hostgroup_name linux-servers service_description Agent: Total Processes check_command check_nrpe!check_total_procs } 主机定义: define host{ use linux-server host_name unixlab alias Unix Lab address PRIVATE } 组/服务器定义: define host{ name linux-server use generic-host alias Linux server hostgroups linux-servers register 0 } 主机inheritance主机组linux-servers中定义的所有服务。 我已经尝试给服务检查一个名称,然后在主机定义中将该名称设置为null,但我认为这个语法是错误的和/或我不理解inheritance的那部分: define service{ […]

复杂的nagios命令

我为我的一个服务检查定义了以下命令: define command{ command_name mycommand command_line $USER1$/check_by_ssh -p $ARG1$ -l nagios -i /etc/nagios2/keys/key1 -H $HOSTADDRESS$ -v -C 'source $USER10$ ; command.py -a get –alert-name $ARG2$ -q' } 问题是,看来nagios正在用分号parsing命令,并产生无法执行的垃圾。 我也尝试了一个反斜杠\; ,无济于事。 如果我直接在shell上运行这个命令,它就可以工作。 这意味着这不是check_by_ssh的问题,而是parsingnagiosconfiguration文件的问题。 我怎样才能debugging呢? 有没有一种方法来获得所有的nagiosparsing读取configuration文件的命令的列表?

自动/定期检查服务器列表上的开放端口

我需要一种方法来configuration在服务器列表上打开端口的计划检查,并在上次检查发生变化时收到通知。 最好的办法是什么? 如果有一些与Nagios交谈的解决scheme会更好。