我在Centos 7机器上运行Nagios 3.5。 该设置用于通过NRPE(check_nrpe命令)监视某些Windows机器。 目前我正在使用'nsclient-full.ini'文件中预先configuration的'别名'命令。 到目前为止,一切正常。 我想使用'alias_updates'命令来监视主机上Windows Update的状态。 ; alias_updates – Alias for alias_updates. alias_updates = check_updates -warning 0 -critical 0 ShowAll=long 以下是定义所有外部脚本的部分: ; A list of scripts available to run from the CheckExternalScripts module. [/settings/external scripts/scripts] check_updates=C:\Program Files\NSClient++\scripts\check_updates.vbs 当然,我已经检查了我提供的path中存在“check_updates.vbs”。 毕竟,它与NSClient ++捆绑在一起。 我已经启用了外部脚本的执行: ; Check External Scripts – A simple wrapper to run external scripts […]
我们使用基于Nagios的Op5来监视服务器。 我们是否需要为服务器提供Ping服务,因为我猜host_check_live (command: $USER2$/check_host -H $HOSTADDRESS$)命令已经使用Ping来查看它是否存在。 不是Ping多余?
我写了一个Nagios检查脚本,它接收一个path作为参数并检查: 如果path被安装 如果可以通过触摸path中的文件进行访问。 如果挂载点目录是空的 [root@hadoop-nn1 mass1]# su – nagios [nagios@hadoop-nn1 ~]$ /usr/lib64/nagios/plugins/check_nfsmount.sh /mass2/hpfiles/ Warning: /mass2/hpfiles/ is mounted but directory is empty! [nagios@hadoop-nn1 ~]$ /usr/lib64/nagios/plugins/check_nfsmount.sh /mass1/hpfiles/ Warning: /mass1/hpfiles/ is MOUNTED properly but not writeable for user nagios [nagios@hadoop-nn1 ~]$ /usr/lib64/nagios/plugins/check_nfsmount.sh /mass1/hp_offline/ Ok: /mass1/hp_offline/ is MOUNTED properly and writeable for user nagios [nagios@hadoop-nn1 ~]$ /etc/nagios/nrpe.cfg的命令如下所示: command[check_nfsmounts]=/usr/lib64/nagios/plugins/check_nfsmounts.sh $ARG1$ […]
我刚刚在几天前放下员工之后inheritance了Nagiospipe理。 作为退出员工程序的一部分,我们更改了员工有权访问的所有帐户的密码。 我继续通过vSphere Client更改我们的ESXi服务器的root密码。 这样做后,Nagios开始显示警报,由于用户名或密码不正确,无法检查服务。 经过几个小时的研究,我已经离开这里寻求帮助。 目前,我不知道问题出在哪里。 我已经检查了与那些ESXi主机相关的Nagios上的所有服务的configuration,并且没有指示我能够使用更新的凭证更新这些服务检查的位置。 ESXi主机也是如此。 我只查看了vSphere Client设置,Nagios Web Interface和我们正在使用的Nagios VM。 任何人都可以请指导我到哪里我可以去补救这个我的困境? 感谢您的时间。
我最近开始使用Nagios监视大约25台服务器(主要是虚拟的,有一些独立的)。 其中大部分服务器(包括Nagios主机本身)都运行Ubuntu 14.04 LTS,less数运行12.04 LTS。 因此,我认为我可以利用NRPE并做到这一点。 configurationNRPE对我来说已经certificate是相当复杂的。 例如,对于一个简单的check_disk命令,我不得不通过排除其他每个分区/文件系统来手动指定要检查的分区,如下所示: command[check_disk]=/usr/lib/nagios/plugins/check_disk -w 57% -x /dev -x /run -x /run/lock -x /run/shm -x /run/user -x /sys/fs/cgroup 否则,我的警告和关键阈值立即由sysfs,proc或其他分区引起。 然后我看了一下Nagios主机自己执行的基本服务监视器。 这是列在/usr/local/nagios/etc/localhost.cfg,并包含以下(我很抱歉!我不明白为什么它不会正确格式!) define service{ use local-service ; Name of service template to use host_name localhost service_description PING check_command check_ping!100.0,20%!500.0,60% } define service{ use local-service ; Name of service template to use […]
我无法弄清楚如何为2个给定的主机组中的所有主机创build一个服务。 示例主机组: oracle: hostA, hostB prod: hostB, hostC 现在我需要为所有在这两个组中的主机提供服务。 在那种情况下,只有hostB 我试图创build一个这样的服务。 但是这将包括所有的产品服务器 define service { service_description Oracle Filesystems use Oracle_PROD_Service hostgroup_name oracle,prod check_interval 3 check_command check_nrpe!check_fs!pkgname:oracle:95:99!!!!!!! register 1 }
我已经configuration了运行NRPE 2.15的客户端configuration的服务器端的Nagios Core版本4.1.0rc2。 我已经使用check_nrpe命令正确地通信了两台设备,但是无论出于何种原因,使用check_procs时,Nagios web门户网站未显示正确的值。 这是来自远程主机的nrpe.cfg: command[check_asterisk_proc]=env COLUMNS=500 /usr/local/nagios/libexec/check_procs -C asterisk -c 1: 以下是从CLI运行时输出的check_nrpe命令: /usr/lib/nagios/plugins/check_nrpe -H 192.168.100.7 -c check_asterisk_proc PROCS OK: 1 process with command name 'asterisk' | procs=1;;1:;0; 但是当你看看Nagios门户网站时,你所看到的只是以下的回应: asterisk-proc OK 08-04-2015 21:17:27 0d 0h 15m 45s 1/3 NRPE v2.15 networking门户中的另一个观点: Status Information: NRPE v2.15 抛开它的是,似乎NRPE正在返回它的版本号,但实际上并没有运行check_procs命令。 有什么我失踪?
我正在使用Nagios来监视我的服务器,并且我需要监视不同服务器之间的连接。 例如,假设我有三台服务器A,B&C,并且所有这些服务器已经由nagios使用check_ping插件进行监视。 现在我想检查这三个服务器之间的内部连接,我的意思是从 服务器A,B&C应该可以到达,同样从B,A&C应该可达,对于服务器C来说是一样的 什么是使用nagios做到这一点。 Server A – can ping to servers B&C Server B – can ping to servers A&C Server C – can ping to servers B&C 我已经尝试过在服务器A中使用多个ping命令,但没有帮助,因为我无法确定服务器B / C是否不能从A command[check_ping]=/usr/lib64/nagios/plugins/check_ping -H 10.16.15.137 -w 3000.0,80% -c 5000.0,100% -p 5 command[check_ping]=/usr/lib64/nagios/plugins/check_ping -H 10.18.42.125 -w 3000.0,80% -c 5000.0,100% -p 5 where 10.16.15.137 -> SERVER B […]
我在Ubuntu桌面(Nagios服务器)上安装了Nagios,我想监视Ubuntu服务器实例(受监视的客户端)。 我可以在两台机器之间通过SSH进行连接,并且不会阻止SSH。 nagios标准服务(如PING和check_users)正常工作,但check_ssh从一开始就保持UNKNOWN状态。 状态信息传递“使用情况:”这是指示参数是错误的。 我可以手动执行检查,在nagios服务器(Ubuntu桌面) /usr/local/nagios/libexec/check_ssh -H 192.168.0.2 SSH OK – OpenSSH_6.6.1p1 Ubuntu-2ubuntu2.3 (protocol 2.0) | time=0,012856s;;;0,000000;10,000000 并在主机(Ubuntu服务器) /usr/lib/nagios/plugins/check_ssh 192.168.0.2 SSH OK – OpenSSH_6.6.1p1 Ubuntu-2ubuntu2.3 (protocol 2.0) | time=0.011613s;;;0.000000;10.000000 这是主机configuration: define host { use linux-server host_name backup alias Backup Server address 192.168.0.2 register 1 } 主机的configuration是标准的: define service { host_name backup service_description Check SSH check_command […]
我为自定义的nagios插件写了一个bash脚本,它传递了两个用于警告和临界阈值的命令参数。 当我在本地运行bash脚本的同时传递两个参数,它可以正常工作(也由su来testingnrpe用户,并在那里工作)。 但是,当我在监视服务器上远程运行脚本时,脚本无法正常工作,这意味着它不会正确分配警告和临界阈值。 从这个我相信这是一个论证传递的问题,但是,我相当确定我已经configuration正确。 唯一奇怪的是,我已经将sudo添加到远程主机上的nrpe.cfg命令中了。 设置看起来像这样: 远程主机 /etc/nagios/nrpe.cfg command[customcheck_bash]=/usr/bin/sudo /usr/lib/nagios/plugins/customcheck.sh –warning $ARG1$ –critical $ARG2$ 监视服务器 /etc/nagios3/commands.cfg define command{ command_name customcheck_bash command_line $USER1$/check_nrpe -H $HOSTADDRESS$ -c $ARG1$ -a $ARG2$ $ARG3$ } /etc/nagios3/conf.d/custom_server.cfg define service { use generic-service host_name client service_description Custom checker check_command check_nrpe!customcheck_bash!10!20 } 任何帮助将不胜感激,我已经看过无数的网站,但似乎无法弄清楚。 谢谢!