Articles of Nagios

使用Nagios监视日志文件并发送日志详细信息

我知道Nagios可以监视和警告日志文件中的内容,但是没有人知道插件或其他工具,它们将监视某个特定string的日志文件,然后通过电子邮件发送整个行那场比赛呢?

Nagios根据服务状态检查服务频率

我试图通过监视si检测磁盘抖动,所以从vmstat命令。 我正在使用nagios监视其他服务,并在每5分钟后进行一次服务检查。 对于这种颠簸服务,我希望nagios每20分钟检查一次,如果返回的状态不正确(即警告或严重),则应每隔3分钟检查一次颠簸服务,直到服务返回状态变为OK。 所有其他服务的服务检查时间保持不变。 我是Nagios新手,任何帮助,将非常感激。

Nagios远程监控:NRPE VS. SSH

我们使用Nagios来监视不less(〜130)台服务器。 我们监视每台服务器上的CPU,磁盘,RAM和其他一些东西。 我一直使用SSH来运行远程命令,纯粹是因为它在远程服务器上几乎不需要额外的configuration,只需安装nagios-plugins,创buildnagios用户并添加SSH密钥,所有这些都已经自动化一个shell脚本。 我从来没有考虑过使用SSH优于NRPE的性能影响。 我对Nagios服务器的负载没有太大的打扰(这可能是过度的,从来没有超过10%的CPU),但我们每30秒运行一次远程检查,每台服务器有5个不同的检查执行。 我认为SSH需要更多的资源为每个检查,但有一个巨大的差异? (IE足够的差异,保证切换到NRPE)。 如果有任何帮助,我们会监控混合使用物理服务器(通常包含8,12或16个物理内核)和Amazon EC2中/大型实例。

Nagios警报通过电子邮件警告和寻呼机CRITICAL

我想将Nagios设置为通过电子邮件发出警告(例如,轻度高负载或磁盘使用),但是对于重要的项目则由寻呼机警告。 现在我们通过电子邮件和寻呼机同时通知所有的警告。 我的通用联系人定义如下: define contact{ name generic-contact service_notification_options w,u,c,r,f,s host_notification_options d,u,r,f,s service_notification_commands notify-service-by-email,notify-service-by-pager host_notification_commands notify-host-by-email,notify-host-by-pager register 0 service_notification_period 24×7 host_notification_period 24×7 } 我该如何做到这一点,使电子邮件通知发生的警告和关键,但分页关键只?

如何解决“(服务检查没有正确退出)”和“(空)”的结果与我的服务?

我在Nagios中使用了一些基于Perl的脚本来进行服务检查,并且我得到了(Service check did not exit properly)和(null) ,结果在Nagios中,但是脚本在命令行上工作的很好。 我在网上看到了解决scheme,build议通过在Nagiosconfiguration中设置enable_embedded_perl=0来禁用内部Perl解释器,或者通过明确指定解释器的path。 这并没有帮助这个问题。 还有什么呢?

到底什么是“check_nrpe_1arg”?

我在很多Nagios文档中看到check_nrpe_1arg 。 任何人都可以解释究竟是什么,或者做什么? 在Nagios文档或networking上的任何其他地方,我什么都看不到,并说“ check_nrpe_1arg does __”。 充其量,它是“你需要在这里check_nrpe_1arg ”,但没有解释什么或为什么。 谢谢!

有没有办法从Nagios主机组中排除特定的主机?

我有一个包含许多主机组的Nagios服务器。 其中一个主机组包括一个服务器,我想排除检查一个特定的Nagios Check但我希望它继续作为主机组的成员,所以它可能会检查所有其他checks hostgroup检查。 有exclude选项或类似的东西可以帮助我实现我的目标吗? 谢谢

让SSH真正安静

我写了一个nagios脚本的一半,我已经与SSH打了个烦恼。 根据手册页: -q Quiet mode. Causes all warning and diagnostic messages to be suppressed. 但是,如果我启用安静的标志,然后通过一个无效的端口,我仍然得到一个错误: $ ssh user@localhost -q -p test Bad port 'test' 这是一个问题,因为这将使这条信息成为第一条线,这就是Nagios所抓的。 在从ssh获取!= 0退出代码后,我需要输出“Warning | SSH error”之类的东西,但是我输出的第一行是第二行。 如何让SSH真正安静? 注意:我不确定是否在serverfault,超级用户或者stackoverflow上发布这个问题。 我去了serverfault作为用户基础可能是最经验的cli SSH和cli脚本解决方法。

更好的Nagios UI?

Nagios的networking用户界面是否优于Nagios的默认版本? 可以帮助我find一个好的?

解释Nagios check_disk输出

Nagios的默认“check_disk”命令的以下命令给出以下输出: # ./check_disk -w 20% -c 10% -p / –units=MB DISK OK – free space: / 17887 MB (47% inode=93%);| /=19481MB;31495;35432;0;39369 一切顺利,但没有人知道最后四个数字(用分号分隔)是什么意思? 除了将命令封装在脚本之外,还有什么办法可以将输出定制为乍一看有意义的东西吗? 提前致谢…