Articles of Nagios

Nagios – 定义为一个组的所有成员的服务*除了一些主机?

我们正在使用nagios来检查我们的ssh服务器是否正在运行。 我们有为某个组的所有成员定义的check_ssh组。 我们还为该组定义了其他服务。 一切安好。 然而,对于这个组中的2个成员,他们在另一个端口上监听ssh。 所以我必须为他们做一个新的服务。 这很好,但后来nagios抱怨说我为相同的主机定义了两次SSH服务。 我可以更改原始的ssh服务以包括组A的所有成员,但排除主机X和Y?

Sensu是CollectD和Nagios的替代品吗?

试图直接在这里得到我的事实。 是Sensu (这个块上的新生儿 )是否可以替代以下两种? Nagios(监控和警报) collectD(在这个设置中给Nagios喂食信息)

Nagios插件在负载较高时执行进程快照

我们已经通过NRPE插件configuration了带有check_load Nagios来监视服务器负载,当负载很高的时候它会报告,但是当时没有select进行快照的顶层进程(如top命令)。 有没有任何nagios NRPE插件?

Nagios:整个主机组的相同主机上的服务依赖关系

我有一个Nagios系统,其中包含大量不同主机组的主机。 这些主机中的每一个都有两个监视的服务,其中一个是依赖于另一个 – 如果service1是WARNING或CRITICAL,那么该服务器上的service2也不应该发出警报。 service2更多地用于统计信息收集,而service1是一个简单的可用性检查 – 因此,我总是希望service2检查,但不警告service1报告为closures。 这是我的services.cfg条目: define servicedependency{ hostgroup example-servers #host_name host1.example.com,host2.example.com service_description service1 dependent_service_description service2 execution_failure_criteria n notification_failure_criteria u,w,c,o } 我已经尝试通过主机组指定它,并作为单个服务器的列表。 理想情况下,我会为整个主机组在一个,而不是不断维护一个列表。 但是,无论如何,这似乎并不奏效。 如果service1closures,则service2在问题屏幕和主机详细信息中也显示CRITICAL状态。

监测工具,不平均的数据随着时间的推移

我正在寻找像Cacti这样的监控系统,它一次不会丢失数据,我发现所有的工具都使用rrd文件,这些文件随着时间的推移将数据平均化。 我希望能够回到(例如)4月1日中午12点,看看当时的数据是什么,而不是整天的平均水平。 有没有可以做到的监控系统?

Nagios升级,警告后过早严重升级

在Nagios 3中,我想要一个服务在关键XX分钟后升级。 它对于从UP到CRITICAL的服务非常有效。 但是,如果服务已经超过了XX分钟(对于缓慢上升的磁盘空间),并且变得至关重要,那么第一个失败就是触发升级。 它正在计数警报升级计数,因为我们希望它在3个CRITICAL警报之后失败,而不是3个警告和一个关键警报。 有没有一个解决scheme,可以让我忽略警告从计数到服务检查升级? 以下是另一个具有相同问题的用户的示例 – 以及非常相似的configuration。 http://copilotco.com/mail-archives/nagios-users.2009/msg00310.html )

为Nagiosconfiguration假期

我有nagiosconfiguration知道这是一个假期: monday -1 may 00:00-24:00 ; Memorial Day (Last Monday in May) 据我所知,周一没有工作,因为我收到了一些警报,没有什么大不了的,我可以忽略这些。 但现在我注意到,这些警报今天(六月一日)没有运行。 我删除了线路,现在他们再次运行。 这是直接的例子timeperiods.cfg,但也许文档是不正确的。 有没有人有Nagios的时间周期configuration,像“上个星期一在五月”或“十一月第四个星期四”的假期工作?

NAGIOS服务/联系人通知命令

我们有3个服务模板, low-priority , high-priorty low-priority和medium-priorty low-priority 。 低优先级服务附加到联系人组low ,中等优先级服务附加到联系人组medium和高优先级(好吧,你可能会明白)。 低优先级服务不通知,中等优先级警报通过电子邮件通知,高优先级警报通过电子邮件和电话通知。 除了他们(还) 我需要做的是指定high-priorty服务生成的任何警报都应运行通知命令notify-service-by-email和notify-service-by-phone 。 通过阅读文档(以及我对Nagios的了解),我知道设置通知命令的唯一方法是联系人中的service_notification_commands选项,但这意味着每个联系人需要两个定义,一个用于电话,一个用于电子邮件。 我将如何获得high-priority服务来调用notify-service-by-phone命令? 更多信息; 服务模板 ;High priority service (Alert by call, 1 min check period) define service{ name high-priority-service notifications_enabled 1 normal_check_interval 1 contact_groups high use generic-service register 0 } ;Med priority service (Alert by email, 5 min check period) define service{ name […]

如何让活动目录authentication用户使用Nagios的networking界面?

我把.htaccess文件放在Nagios html根目录和CGI根目录下,所以为了访问web界面,用户需要一个有效的Active Directory帐户。 我有的问题是在/etc/nagios/cgi.cfg里面说的 use_authentication=1 authorized_for_system_information=nagiosadmin authorized_for_configuration_information=nagiosadmin authorized_for_system_commands=nagiosadmin authorized_for_all_services=nagiosadmin authorized_for_all_hosts=nagiosadmin authorized_for_all_service_commands=nagiosadmin authorized_for_all_host_commands=nagiosadmin 设置use_authentication=0 “解决”的问题,但我已阅读 此外,禁用身份validation会导致各种事情不起作用,因为程序员不想为发生什么负责最好使用身份validation,然后正确设置它;-) 所以我并不太热衷于此。 应该可以用一个组来代替nagiosadmin 基本上所有这些“authorized_for_”的东西是允许“pipe理”用户访问系统。 他们没有告诉你的一个便利是你可以把组名称而不是用户帐户,所以如果你有一个ITpipe理员组定义,把它,而不是所有的成员组 题 当用户使用Apache的mod_authz_ldap.so通过htaccess进行身份validation时,如何定义这样的组?

Nagios:如何将大量通知汇总到一个电子邮件通知中?

我有一个监视许多服务器的Nagios服务器。 有一个内部编码的仪表板,它使用被动检查将监控数据发送到Nagios服务器。 每当有问题发生时,NOC团队就会收到电子邮件通知。 我的目标是: 当问题发生时,即使仪表板向Nagios发送100封通知电子邮件,我也希望Nagios将通知汇总到一个通知中。 那么我希望Nagios在问题解决之后再发送一个通知。 它是如何完成的?