Nagios 服务器 Gind.cn

没有连接到HP OVO时，使Nagios堆栈报警

我正在专用笔记本电脑上实施一个小型的Nagios实例来监视一些telcom设备。警报必须通过我们的客户报告工具（如HP OpenView）通过SNMP陷阱发送。这里没什么特别的。但是，子系统是移动的，因此并不总是具有连通性来报告警报。我们依靠3G调制解调器来提供此连接（如果可用）进行报告。在没有与监控工具连接的情况下，是否有任何意义使Nagios“堆栈”报警，以便一旦连接恢复，它就可以传送报警的最后一个状态？我首先想到了一个“中间人”计划，它将成为Nagios和监控工具之间的桥梁，并处理陷阱。它将采取所有来自Nagios的snmp陷阱，并且如果没有可用的连接性，将它们插入然后传递最后的陷阱… 但是我不知道这样的事情是否存在，就我所search到的，我什么都没发现。

以root身份运行插件：NRPE无法读取输出

我有一个nagios和NRPE的问题，我无法解决它。我已经试过了。 # grep "nrpe_user=" /etc/nagios/nrpe.cfg nrpe_user=nrpe NRPE作为用户nrpe运行。所以我加了这句话visudo： Defaults:nrpe !requiretty nrpe ALL=(ALL) NOPASSWD: /usr/lib64/nagios/plugins/check_jboss_files 我编辑了我的nagios nrpe.cfg： command[check_jboss_files]=sudo /usr/lib64/nagios/plugins/check_jboss_files 但是，如果我尝试从Nagios服务器运行命令，我得到以下内容： # /usr/lib64/nagios/plugins/check_nrpe -H 1.2.3.4 -c check_jboss_files NRPE: Unable to read output 脚本在本地启动时按预期运行，即使以用户nrpe运行： # sudo sudo -s -u nrpe bash-4.2$ sudo /usr/lib64/nagios/plugins/check_jboss_files JBOSS Files: 2049 WARNING – JBOSS Files: 2049 如果没有sudo脚本正在使用nagios服务器，但必须使用sudo才能获得良好的结果。我错过了什么？我可能已经尝试了一切，我会很感激任何帮助。

（Nagios）NRPE不将parameter passing给检查

自从现在几个小时以来，我一直试图创build自己的NRPE检查，但仍然失败。我想使用2个检查： check_load ， check_disk 我的问题是，NRPE不会将检查参数转发到nrpe.cfg指定的检查。这是我的objects-config，它定义了两个远程检查： define service{ use local-service host_name localhost service_description Disk-Space check_command check_nrpe!check_disk!20%!10% } define service{ use local-service host_name localhost service_description CPU-Load check_command check_nrpe!check_load!0.15,0.10,0.05!0.15,0.10,0.05 } 另外，这是我对check_nrpe commands.cfg ： # define nrpe command define command{ command_name check_nrpe command_line $USER1$/check_nrpe -H $HOSTADDRESS$ -c $ARG1$ -a $ARG2$ $ARG3$ } 最后，这是我的nrpe.cfg的必要部分： command[check_load]=/usr/local/nagios/libexec/check_load -r -w $ARG1$ […]

Opsview：使用多个不同参数的服务

我目前正在看Opsview，看起来很安静。我下载了虚拟设备进行一些testing，目前我有点卡在我认为很容易的部分。我想定义一个服务检查，它需要一个参数（$ ARG1 $）。这个服务现在应该被分配给主机多次，但是参数的值不同。这可能与Opsview？我甚至无法用参数定义服务检查，然后指定这个参数。最后我select“exception”，然后在那里用参数$ ARG1 $replace所需的值。这不可能是实现这个目标的正确方法吗？

升级通知，无论时间期限如何

我的oncall旋转定义了基于个人地理graphics位置的时间段。但是，无论何时发生，我们的升级都需要传递给整个团队。目前我发现在nagios中configuration这个的唯一方法是为每个人创build两个联系人一个是特定时间段，另一个是24×7，然后在升级中使用24×7联系人。我希望每个人只能保持1次联系。 define contact { contact_name bobjones service_notification_period ops-shift4-oncall host_notification_period ops-shift4-oncall host_notification_options d,u,r service_notification_commands service-notify host_notification_commands host-notify email [email protected] pager bjones } define contact { contact_name bobjones_24x7 service_notification_period 24×7 host_notification_period 24×7 host_notification_options d,u,r service_notification_commands service-notify host_notification_commands host-notify email [email protected] pager bjones }

拍打UNKNOWN Nagios状态的原因是什么？

我们通过OpsView运行一些Nagios服务检查，我们的主机之一得到了一个奇怪的SSH响应： “未知：服务结果陈旧” 它经常发生，但似乎随着系统第二次和第三次重试而消失。它在上个星期的补丁和重启服务器之后开始。系统本身响应从我testing过的盒子（这不包括监视系统，我不给予访问）的SSH。 / var / log / secure充满了行ala： sshd[15628]: Did not receive identification string from xxx.xxx.226.20 时间戳是每五分钟可靠的，这很明显是监控脚本一旦得到login提示就断开连接。任何人都知道可能是什么原因造成的，或者如何解决？看到这个popup和closures状态页面真的令人沮丧。

nagios错误127：./check_icmp：没有这样的文件或目录（一些插件不会执行）

我正在运行opsview（nagios）和1个从服务器不能正确执行一些插件 Return code of 127 is out of bounds – plugin may be missing 当我手动执行插件它说 ./check_icmp bash: ./check_icmp: No such file or directory 在执行插件时，它在主站和其他从站上工作我一直在Google上search和尝试一些东西，但无法正常工作编辑：由凯尔·布兰特解决（见评论）

在opsview中使用第三方工具

如何使用第三方工具，如nagstamon nagios监控或iphone工具与opsview？看起来没有cgi-bin（你会被redirect到status / hostgroup）

用于测量和报告服务器电源效率的OpenSourcepipe理工具

我想使用像Nagios或OpenNMS这样的开源pipe理工具来测量服务器的功效（虚拟化）。仙人掌也可能是有用的，因为它的历史graphicsfunction，但它似乎没有像插件等Nagios灵活。我没有物理访问服务器，只有远程访问。如何捕获所需的信息并报告使用这些工具？我来自networkingpipe理背景，所以不太熟悉服务器电源pipe理。谢谢！凯特

使用pnp4nagios绘制服务

我已经设法安装pnp4nagios 0.6.3，我对pnp4nagios如何生成graphics有点困惑。几乎开箱即用，它启动了ping和一些http服务器（不是全部）的graphics。但是，我怎样才能使它像磁盘利用率的东西（当这个值来自SNMP）？例如， ls /usr/local/pnp4nagios/var/perfdata/isis/ Cola_de_Mail.rrd Cola_de_Mail.xml HTTP.rrd HTTP.xml PING.rrd PING.xml 这些是在主机isis上运行的检查，但是还有许多其他检查是不受pnp4nagios考虑的。我怎样才能使pnp4nagios“看到”其他检查？谢谢！

Intereting Posts

WSUS API获取更新需要计数 iptables不logging任何东西什么是mdbs_daemon，为什么它在服务器上的端口800上监听？ snmp：获取短接口名称而不是long ifDescr（再次）推荐一个USB闪存复印机（基于软件或硬件）保持简单愚蠢的按位复制使用Set-OWAMailboxPolicy禁用OWA Light后，如何将已将OWA Light设置为首选项的用户重新获得对OWA的访问权限？没有名称服务器的Linux CNAME 如果在Windows域中DC之间的复制无法发生，可能的结果/副作用是什么？ gentoo在哪里存储mongodb.conf？要更改dbpath位置木偶ERB模板 – 关于定义的类的问题 Nginx的www到非www，转发到http，并转发到https在特定的位置 ORA-01019错误只作为pipe理员点logging到stream量pipe理员azure色的IP？识别切断某个端口的路由器只是安装了Ubuntu服务器和灯服务器，PHP不工作

Articles of Nagios