我对icinga很新。 事实上,我今天完成了设置。 我试图监视我的nrpe机器上的一堆东西。 我在/etc/icinga/objects/my.server.com.cfg设置了我的服务,并像这样configuration它: define host{ use generic-host host_name my.server.com alias my.server.com address 123.45.678.999 } define service{ use generic-service host_name my.server.com service_description Total Processes check_command check_procs!250!400 } 当我在pipe理界面看,我想知道为什么所有的服务器有相同数量的进程活跃,但在检查命令icinga执行后,我意识到所有命令正在执行在icinga服务器本身而不是nrpe机器。 我的错误在哪里? nrpe.cfg设置正确,将我的icinga服务器列入白名单。 Telnet连接正常工作。
我试图检测服务器上的CheckEventLog条目,所以我试图使用CheckEventLog命令: ./check_nrpe -H hostname -c CheckEventLog -a MaxWarn=1 MaxCrit=1 "filter=generated gt -3d AND id=23 AND source='mpio'" truncate=800 unique "syntax=%severity%: %source%: %id%: %message% (%count%)" 但是,我总是从客户端得到一个错误: Exception processing request: Request command contained illegal metachars! 我已经设置了允许讨厌的元字符的选项,但这似乎没有帮助。 [/settings/NRPE/server] allow arguments = true allow_nasty_meta_chars = 1 如果我拿出filter的source部分,它的工作原理,但是事件ID本身并不是唯一的。
尝试从我的nagios服务器获得主机的Windows主机检查。 在这一点上,我甚至没有使用nagios,只是从命令行运行check_nt。 validation端口是开放的,它允许telnet 确保不安全模式在nsclient.ini中configuration 确保连接主机进入“允许主机” 在这一点上,安全不是一个问题,所以不需要encryption/密码等。 对于故障排除,我只是运行“CLIENTVERSION”命令,因为它很简单 我已经确保nsclient ++服务具有“允许与桌面交互”选项。 这是我从允许的主机使用的命令: check_nt -H 10.10.5.200 -p 12489 -v CLIENTVERSION 这是输出: [root@nagioshost]# /usr/lib64/nagios/plugins/check_nt -H 10.10.5.200 -p 12489 -v CLIENTVERSION No data was received from host! could not fetch information from server 运行'nscptesting'我可以看到连接进来,但失败: D nrpe Accepting connection from: 10.10.7.101, count=1 E nrpe Failed to establish secure connection: short read: […]
脚本在服务器上: #!/斌/庆典 如果[! $#== 1]; 然后 echo“用法check_cluster” networking连接; clu_srv = $ 1 错误=“停止” ERROR1 = “禁用” 误差2 =“可恢复” host1 =`sudo / usr / sbin / clustat | grep $ 1 | awk {'print $ 2'}` host2 =`sudo / usr / sbin / clustat | grep $ 1 | awk {'print $ 3'}` service1 =`sudo / […]
我有以下ntp通过NRPE检查我的服务器上的Nagios /usr/local/nagios/nrpe_plugins/check_ntp_time -H localhost -w 0.5 -c 1 -q 通过date命令手动将date更改为过去的date时: date –set="16 JAN 2017 15:00:00" 检查总是给出一个OK状态输出 NTP OK: Offset -1.442432404e-05 secs|offset=-0.000014s;0.500000;1.000000; 尽pipe抵消了 remote refid st t when poll reach delay offset jitter ============================================================================== 10.7.100.65 176.58.109.199 3 u 4971 64 7 0.246 6136468 4339138 10.8.100.65 188.114.116.1 3 u 4971 64 7 1.571 6136468 4339138 10.7.91.41 217.114.59.66 […]
Nagios我有一个非常奇怪的问题。 由于某种原因,check_apt似乎失败了,我不知道为什么。 它的行为就像没有运行检查。 我有nrpe运行在箱子开发和所有其他检查运行良好。 在安装了nagios的盒子上,定义如下。 define service{ use generic-service host_name development service_description APT check_command check_nrpe!check_apt } 在“开发”nrpe.cfg包含以下行。 command[check_apt]=/usr/lib/nagios/plugins/check_apt -n 此外,如果我在安装Nagios的盒子上,并执行以下操作! /usr/lib/nagios/plugins/check_nrpe -H development -c check_apt 哪个返回 APT OK: 0 packages available for upgrade (0 critical updates). 那么,这里有什么不对? 看起来其他NRPE插件工作正常,只有APT似乎失败,并手动运行在框中似乎工作。 build议?
首先:我知道已经有关于这个问题的问题,但是即使使用他们的答案,我仍然不知道为什么我的命令不起作用。 我想要做的是使用NRPE在远程主机上调用脚本。 但是,这个脚本要做什么可能只能由特定用户执行(我们称他为userA )。 现在,我的NRPE命令如下所示: command[debug_now]=/usr/local/bin/debug_now 我的sudoers有条目nagios ALL=(tomcat) NOPASSWD: /usr/local/bin/debug_now因为我注意到用户调用nrpe.cfg的脚本叫做nagios 。 脚本/usr/local/bin/debug_now看起来像: #!/bin/sh whoami echo "Debug…" sudo -u tomcat whoami echo "Debug finished" 上面的脚本具有与其他脚本可以由用户nagios执行相同的权限。 更重要的是,当它在本地执行它相当打印: nagios Debug… tomcat Debug finished 它一般按照预期工作。 但是,从pipe理主机中调用时,只能打印 nagios Debug… Debug finished 这可能是由NRPE: Cannot read output引起的NRPE: Cannot read output ,每当我尝试从pipe理主机中获取任何内容时都会显示。 我已经尝试添加到sudoers项目Defaults !requiretty没有成功。 我使用Debian 6.0.7。 当从pipe理主机中调用脚本时,我能做些什么来使脚本工作? 编辑。 首先,目录/etc/sudoers.d/只包含文件README。 userA真实姓名应该是tomcat让我们来看看visudo输出然后: Defaults env_reset Defaults […]
我刚刚尝试过在monitoringexchange.org上find的check_mysqld ,但事实certificate,它输出的格式不pipe是NRPE 2.12还是Nagios 3.2.1都不理解。 任何人都可以推荐一个与NRPE一起使用的Nagios 3插件吗?
有谁知道如何将variables设置为全局值? 我目前每2分钟就会收到一次通知(例如,每次nrpe检查器运行一个服务),这会非常烦人。 每个服务的编辑都会变得非常繁琐,因为每个服务都有五个位置和几十个服务) 所以 – 我如何设置全球? 还有什么build议? notification_interval 问候,五
我目前设置了一个脚本来重新启动我的http服务器+ php5 fpm,但不能得到它的工作。 我GOOGLE了,发现大多数权限是我的错误的问题,但无法弄清楚。 我开始使用我的脚本 /usr/lib/nagios/plugins/check_nrpe -H bart -c restart_http 这是我希望重新启动的节点上的系统日志中的输出 Jun 27 06:29:35 bart nrpe[8926]: Connection from 192.168.133.17 port 25028 Jun 27 06:29:35 bart nrpe[8926]: Host address is in allowed_hosts Jun 27 06:29:35 bart nrpe[8926]: Handling the connection… Jun 27 06:29:35 bart nrpe[8926]: Host is asking for command 'restart_http' to be run… Jun 27 […]