我的一台服务器运行Nagios(开源),过去是由别人安装的,工作得很好,直到我改变了windows.cfg文件,现在当我尝试启动守护进程时,它说有错误configuration。 当我尝试运行configurationvalidation,它不会给出任何错误或警告,但只检查我没有改变的nagios.cfg。 问题是,是否可以validation/debuggingwindows.cfg和commands.cfg? 或者这可能是由另一个问题引起的? 谢谢。
我希望能够检查远程主机上的几个东西,从内部的nagios – CPU,内存等,所以,我期待在机器上安装NRPE。 NRPE想要安装Samba以及我完全理解的其他许多服务。 有没有办法只安装NRPE命令的一个子集,所以我不需要安装所有相关的软件包?
我想直接从Nagios服务文件中调用一个命令,而不是将参数笨拙地传递给commands.cfg。 比如我想要这样做: define service { service_description footest check_command $USER1$/check_http example.com -u http://example.com/index.html use generic-service host_name example } 但是我得到一个: Error: Service check command '/usr/share/nagios/libexec/check_http example.com -u http://example.com/index.html' specified in service 'footest' for host 'example' not defined anywhere!
当监视服务器的健康状况时,一些故障或警告立即是紧急的,但是其他故障或警告只在持续时才重要。 我正在考虑这样的事情: 有些软件需要更新 时间偏移量与NTP不同 如果没有得到解决,这些问题可能会成为真正的问题,但已经有后台服务来照顾他们 – 无人看pipe的升级,NTP客户端服务等等。问题产生和这些后台进程之间总是有一个短暂的延迟来解决它们,我们的监视器正在发送一系列电子邮件,然后在一分钟后问题得到解决。 我通常会醒来发现一大堆“问题”电子邮件,每封邮件都有一分钟后发送的相应“解决scheme”电子邮件。 危险的是,在驳斥一百个不相干的警告的时候,我可能会错过那个真实的。 那么有什么方法可以指示Icinga或Nagios只报告一个问题,如果持续超过一定的时间,比如5分钟?
警报消息的默认格式是: **恢复主机警报:服务器已启动** ***** Nagios ***** 通知types:RECOVERY 主机:服务器 状态:UP 地址:server.ru 信息:PING OK – 分组丢失= 0%,RTA = 26.00 ms date/时间:星期四8月13日17:08:16 MSD 2009 我想用最less的字母来获取最大的信息 首先,能够从SMS获取信息。 其次,要在90%的情况下只读取电子邮件的标题。 例如,以前的消息可以是“ H: server is UP ”,其中H代表Host Alert 。 如果这个服务器closures了,我想得到这样一个信息: [!] H: server is DOWN 。 而不是消息,“交换服务器上的使用率是关键”我想得到“[:服务器/交换使用率是> 50%”其中50是从check_swap的nagiosconfiguration,而不是硬编码到消息。 如果“路由器/ wan2是关键”,我想看到“ADSL通道closures”。 所以,总结一下,我想分别为每个服务及其状态定制消息,并能够在文本中使用插件参数。 我怎样才能做到这一点?
如何使用check_nt命令而不是百分比值检查Nagios中剩余的空间(MB或GB)的确切数量? 目前我正在使用这个命令: check_command check_nt!USEDDISKSPACE!-lc -w 90 -c 95 但是这是检查已使用磁盘空间的百分比值,并且我希望在某些驱动器上剩余一定数量的GB时收到通知(例如,警告何时剩余10GB,如果剩余只剩下5GB,则会发生严重错误)。 谢谢
我有一堆电脑与本地USB连接的打印机。 我希望能够使用Nagios监控卡纸和碳粉水平等情况,但是我所能find的所有内容都涉及使用SNMP。 我如何使用Nagios来监视本地USB打印机?
我们有一台XP机器,它在清晨运行计划任务,不幸的是必须login到某个用户的桌面才能工作。 不幸的是,该用户有时会从pipe理员login(并忘记重新login到正确的用户)或重新启动以应用安全更新等方式被注销。 我想让Nagios监视当前login的用户,确认它是正确的。 Nagios正在Linux上运行。 到目前为止,我已经与当前用户查找了一个SNMPvariables。 我没有运气。 我尝试了snmpbulkwalk -m all -v2c -c community machine并为其用户名grep'd,并做了一个login前和login后,并检查差异,没有发现什么有用的。 我检查了net命令(来自Samba),但是我没有看到任何东西 – 虽然我承认它可能是我错过了一些东西。 各种session选项似乎只显示net会话(即使我使用我的域pipe理员帐户)。
我在一台机器上有两个被动的服务:ServiceA,ServiceB。 OK状态满足以下条件时,我想有一个sittuation: ServiceA正常或ServiceB正常 ServiceA正常,SericeB正常 我想在下列情况下发出警报: 服务Aclosures,服务Bclosures 我应该使用什么configuration选项来实现? 服务依赖性看起来不错,但我没有那个运气。
我有一些位于EC2上的NT盒,我想监视它。 问题在于,Nagios盒子需要知道它可以连接到的IP地址,以便进行监视,并且每次启动时都会更改实例的IP地址。 有没有这样做的好方法,还是我会被迫编写一个程序来调查EC2的API?