我正在专用笔记本电脑上实施一个小型的Nagios实例来监视一些telcom设备。 警报必须通过我们的客户报告工具(如HP OpenView)通过SNMP陷阱发送。 这里没什么特别的。 但是,子系统是移动的,因此并不总是具有连通性来报告警报。 我们依靠3G调制解调器来提供此连接(如果可用)进行报告。 在没有与监控工具连接的情况下,是否有任何意义使Nagios“堆栈”报警 ,以便一旦连接恢复,它就可以传送报警的最后一个状态? 我首先想到了一个“中间人”计划,它将成为Nagios和监控工具之间的桥梁,并处理陷阱。 它将采取所有来自Nagios的snmp陷阱,并且如果没有可用的连接性,将它们插入然后传递最后的陷阱… 但是我不知道这样的事情是否存在,就我所search到的,我什么都没发现。
我有一个nagios和NRPE的问题,我无法解决它。 我已经试过了。 # grep "nrpe_user=" /etc/nagios/nrpe.cfg nrpe_user=nrpe NRPE作为用户nrpe运行。 所以我加了这句话visudo: Defaults:nrpe !requiretty nrpe ALL=(ALL) NOPASSWD: /usr/lib64/nagios/plugins/check_jboss_files 我编辑了我的nagios nrpe.cfg: command[check_jboss_files]=sudo /usr/lib64/nagios/plugins/check_jboss_files 但是,如果我尝试从Nagios服务器运行命令,我得到以下内容: # /usr/lib64/nagios/plugins/check_nrpe -H 1.2.3.4 -c check_jboss_files NRPE: Unable to read output 脚本在本地启动时按预期运行,即使以用户nrpe运行: # sudo sudo -s -u nrpe bash-4.2$ sudo /usr/lib64/nagios/plugins/check_jboss_files JBOSS Files: 2049 WARNING – JBOSS Files: 2049 如果没有sudo脚本正在使用nagios服务器,但必须使用sudo才能获得良好的结果。 我错过了什么? 我可能已经尝试了一切,我会很感激任何帮助。
自从现在几个小时以来,我一直试图创build自己的NRPE检查,但仍然失败。 我想使用2个检查: check_load , check_disk 我的问题是,NRPE不会将检查参数转发到nrpe.cfg指定的检查。 这是我的objects-config,它定义了两个远程检查: define service{ use local-service host_name localhost service_description Disk-Space check_command check_nrpe!check_disk!20%!10% } define service{ use local-service host_name localhost service_description CPU-Load check_command check_nrpe!check_load!0.15,0.10,0.05!0.15,0.10,0.05 } 另外,这是我对check_nrpe commands.cfg : # define nrpe command define command{ command_name check_nrpe command_line $USER1$/check_nrpe -H $HOSTADDRESS$ -c $ARG1$ -a $ARG2$ $ARG3$ } 最后,这是我的nrpe.cfg的必要部分: command[check_load]=/usr/local/nagios/libexec/check_load -r -w $ARG1$ […]
我目前正在看Opsview,看起来很安静。 我下载了虚拟设备进行一些testing,目前我有点卡在我认为很容易的部分。 我想定义一个服务检查,它需要一个参数($ ARG1 $)。 这个服务现在应该被分配给主机多次,但是参数的值不同。 这可能与Opsview? 我甚至无法用参数定义服务检查,然后指定这个参数。 最后我select“exception”,然后在那里用参数$ ARG1 $replace所需的值。 这不可能是实现这个目标的正确方法吗?
我的oncall旋转定义了基于个人地理graphics位置的时间段。 但是,无论何时发生,我们的升级都需要传递给整个团队。 目前我发现在nagios中configuration这个的唯一方法是为每个人创build两个联系人 一个是特定时间段,另一个是24×7,然后在升级中使用24×7联系人。 我希望每个人只能保持1次联系。 define contact { contact_name bobjones service_notification_period ops-shift4-oncall host_notification_period ops-shift4-oncall host_notification_options d,u,r service_notification_commands service-notify host_notification_commands host-notify email [email protected] pager bjones } define contact { contact_name bobjones_24x7 service_notification_period 24×7 host_notification_period 24×7 host_notification_options d,u,r service_notification_commands service-notify host_notification_commands host-notify email [email protected] pager bjones }
我们通过OpsView运行一些Nagios服务检查,我们的主机之一得到了一个奇怪的SSH响应: “未知:服务结果陈旧” 它经常发生,但似乎随着系统第二次和第三次重试而消失。 它在上个星期的补丁和重启服务器之后开始。 系统本身响应从我testing过的盒子(这不包括监视系统,我不给予访问)的SSH。 / var / log / secure充满了行ala: sshd[15628]: Did not receive identification string from xxx.xxx.226.20 时间戳是每五分钟可靠的,这很明显是监控脚本一旦得到login提示就断开连接。 任何人都知道可能是什么原因造成的,或者如何解决? 看到这个popup和closures状态页面真的令人沮丧。
我正在运行opsview(nagios)和1个从服务器不能正确执行一些插件 Return code of 127 is out of bounds – plugin may be missing 当我手动执行插件它说 ./check_icmp bash: ./check_icmp: No such file or directory 在执行插件时,它在主站和其他从站上工作 我一直在Google上search和尝试一些东西,但无法正常工作 编辑:由凯尔·布兰特解决(见评论)
如何使用第三方工具,如nagstamon nagios监控或iphone工具与opsview? 看起来没有cgi-bin(你会被redirect到status / hostgroup)
我想使用像Nagios或OpenNMS这样的开源pipe理工具来测量服务器的功效(虚拟化)。 仙人掌也可能是有用的,因为它的历史graphicsfunction,但它似乎没有像插件等Nagios灵活。 我没有物理访问服务器,只有远程访问。 如何捕获所需的信息并报告使用这些工具? 我来自networkingpipe理背景,所以不太熟悉服务器电源pipe理。 谢谢! 凯特
我已经设法安装pnp4nagios 0.6.3,我对pnp4nagios如何生成graphics有点困惑。 几乎开箱即用,它启动了ping和一些http服务器(不是全部)的graphics。 但是,我怎样才能使它像磁盘利用率的东西(当这个值来自SNMP)? 例如, ls /usr/local/pnp4nagios/var/perfdata/isis/ Cola_de_Mail.rrd Cola_de_Mail.xml HTTP.rrd HTTP.xml PING.rrd PING.xml 这些是在主机isis上运行的检查,但是还有许多其他检查是不受pnp4nagios考虑的。 我怎样才能使pnp4nagios“看到”其他检查? 谢谢!