我的nagios监控有问题。 我正在尝试使用nrpe检查远程主机上的进程。 主机已经被nagios监视,所以我只需要添加一行到nrpe.cfg文件。 甚至已经有一个check_procs检查,所以我可以使用这个例子。 这么简单,你可能会厚,但不。 我检查是否可以手动运行命令,没有问题! ubuntu@host:/usr/lib/nagios/plugins$ ./check_procs -w 1:1 -c 1:1 -a delayed_job PROCS OK: 1 process with args 'delayed_job' ubuntu@host:/usr/lib/nagios/plugins$ sudo ./check_procs -w 1:1 -c 1:1 -a delayed_job PROCS OK: 1 process with args 'delayed_job' 这是我的nrpe.cfg文件: command[check_procs]=/usr/lib/nagios/plugins/check_procs -w $ARG1$ -c $ARG2$ -s $ARG3$ command[check_proc_name]=/usr/lib/nagios/plugins/check_procs -w $ARG1$ -c $ARG2$ -a $ARG3$ 第一个检查check_procs被正确监视,最后一行是我添加的,但是响应这个: PROCS CRITICAL:2个进程与args'delayed_job' […]
我可能只是需要一些额外的见解,因为我没有看到我要去哪里错了。 我使用SSL证书来保护我们的nagios服务器。 我们想特别要求所有通过nagios的stream量(如2个用户,lol)使用SSL。 所以我想,哦,mod_rewrite +在.htaccess重写规则,对不对? 所以我进入了DocumentRoot并做了一个vi .htaccess(一个还不存在),然后我遵循下面的规则: RewriteEngine On RewriteCond %{SERVER_PORT} 80 RewriteRule ^(.*)$ https://our.server.org/$1 [R,L] 这绝对没有。 纳达 Whhhyy .. 注意:httpd.conf中的AllowOverride全部打开。 另外,我validation了这个模块没有被注释掉,但是注意,我找不到安装的mod_rewrite模块,所以我从另一个服务器上复制了它,并把它放在modules / mod_rewrite.so中。 这很奇怪,因为它在httpd.conf文件中启用,但是在模块中不存在… 我是坏人:(
我想检查我的nagios监视每个节点是否使用puppetmaster提供的当前目录版本。 在我的情况下,有: 木偶大师 主机1 主机2 主机X 我想在host1,host2,hostX上创buildnrpe插件: 检查主机上的当前目录版本 检查为puppetmaster上的节点准备的当前目录版本 警告,如果两者不同 问题: 要检查puppetmaster上的目录版本,我可以运行/ production / catalog API查询,但是它非常昂贵(cpu) – 因为每当我请求时都需要编译目录。 我看不到任何选项来检查节点上的当前目录版本。 我尝试了木偶目录,但这不是很有帮助。 所以我的问题是,如何监视木偶代理人的健康,并得到通知,如果任何主机使用旧的木偶目录? 这有什么意义吗?
我对以前的工作(主要是Nagios)的服务器监控产品有一点经验,但从来没有机会从头开始build立监控计划。 每当有一些需要监控的机器时,运行Nagios守护进程(我认为这里有一个奇特的名字,但是这里没有提到我的记忆)以及运行Nagios的专用机器。 现在我是自雇人士,大多数时候,我发现自己为我的客户(存储,邮件,无线局域网控制器等)设置了一台服务器。 是否有某种LIGHTWEIGHT监控解决scheme可以在应该监控的同一台机器上运行? 我很清楚,Nagios(以及其他商业和开源监控应用程序)能够做到这一点,但我反对的理由是 – 它过度杀毒(更不用说滥用系统资源)和-two-存在不好的做法是这样的。 请随时提出任何解决scheme,当然教育我,如果我是错误的东西。 要注意的是,我接受的观点可能需要一定程度的“黑客”。 我没有明确地设置部署一个预先构build的应用程序,任何解决scheme将会被考虑。 编辑:这是一个单一的要求。 我需要它能够以自定义的方式响应事件(分配脚本作为对触发器的响应)。
我们已经将Nagios安装了一年,现在我们需要给出一些统计数据,说明它在这个环境中的工作量和做了什么。 因此,我想知道是否有人知道Nagios是否也持有关于它发出多less警报和通知的数据logging? 我不一定是在寻找关于它提醒的报告,而只是一些关于幻灯片的原始统计数据。 TL:DR我可以提取Nagios在存在或在特定date之间生成的通知和警报数量吗?
我需要添加名称为美元符号的Windows SQL服务的Nagios检查(例如MSSQL$TOLLCONNECT ),但是到目前为止,我们还无法确定如何传递这个名称,而Nagios则将其视为一个variables名称。 这样做最简单的方法是什么,除了修改服务名称本身,这会打破其他的东西? 我在目标机器上运行NSClient ++,并考虑使用硬编码名称来创build检查,但是这个想法留下了很多不足之处,因为它造成了维护的噩梦。
我有一个驻留在隔离networking上的OpenVPN服务器机器,公司防火墙中的NAT规则将所有来自我select的公共IP的端口1194(tcp)的stream量redirect到OpenVPN服务器机器的内部地址。 我想创build一个Nagios检查来监视OpenVPN服务器的可用性。 考虑到支票将从世界(Nagios服务器)运行,而不是从公司内部运行,最好的监控方法是什么?
我想给Nagios监视的系统添加注释。 我更喜欢使用check_mk作为GUI。 现在我偶然发现:我可以设置一个评论粘滞和/或持久性。 所以我问我们Nagiospipe理员粘滞和持久性之间的区别是什么。 事实certificate,他不知道“粘性” – 这必须是check_mk特定的。 在谷歌和check_mk文件的审查之后,我找不到有关该主题的任何内容。 那么:Nagios服务注释的粘性和持久性有什么区别? 更新 :这里是一个截图 – check_mk快速search特定的服务器,然后select哈默符号。 然后这将显示: 问题是关于确认框:粘性与持久性
我已经启动了Nagios Core,并且找不到任何方法来安排主机的正常停机时间。 例如,假设我有一个计划在每周日凌晨1点重新启动的主机。 我希望能够把“每个星期天凌晨1点到凌晨1点10分”的停机时间安排到纳吉奥斯,但我唯一看到的是一次一个事件。
我已经尝试了nagios的最佳插件SMART监控。 有一些,但只有监测温度。 但是通过smartctl,我们可以find更多的数据。 你有更好的插件与智能的所有数据?