我有一组机器都运行相同的检查。 在这个组里面有dev机器和prod机器。 我只是想在小时之后提醒机器是prod机器。 用最less量的变化,最简单的方法是什么? 谢谢。
我想知道是否可以设置nagios以正常的格式显示其正常页面(例如关键警报)(红色表示关键页面上的所有警报)和基本文本格式(无颜色或graphics,没有链接主持人)。 我正在寻找的是在我们的壁挂式监视器上显示所有人都能看到的普通页面,以及一个基本的文本页面,这样,如果警报必须通过电子邮件发送到某些组,则可以使用纯文本。 正在考虑创build我自己的页面,并将其粘贴在nagios / html文件夹,但尝试与testing页面似乎并不工作(页面可见,但不更新)。 任何帮助表示赞赏。 提前致谢。
最近我们遇到了很多垃圾邮件攻击我们的服务器,导致apache崩溃。 要解决这个问题,我们已经安装了nagios来通知我们/运行一些重启命令,如果出现问题。 通知function正常,但重新启动脚本不会踢。我们采取了以下步骤: 创build我们的重启脚本位于: /usr/share/nagios3/plugins/eventhandlers/restart_apache testing并通过./restart_apache CRITICAL SOFT 3 – 可以确认脚本正常工作 定义了命令: /etc/nagios3/commands.cfg 定义命令{ command_name重新启动apache command_line / usr / local / nagios / libexec / eventhandlers / restart_apache $ SERVICESTATE $ $ SERVICESTATETYPE $ $ SERVICEATTEMPT $ } 在当前加载通知运行时应用该命令来触发: /etc/nagios3/conf.d/localhost_nagios2.cfg 定义服务{ 使用通用服务; 要使用的服务模板的名称 host_name localhost service_description当前负载 check_command check_load!5.0!4.0!3.0!10.0!6.0!4.0 event_handler restart-apache } 我们已经设置脚本在执行重新启动时写入文本文件,但没有任何事情发生(并且apache停留) – 所以有些事情是不正确的。 任何方向非常感谢!谢谢
我们最近在我们的一个Amazon EC2实例上设置了Nagios ,作为其他实例的监控服务器。 nrpe安装在我们的登台服务器nrpe上,似乎工作正常: monitoring_server~: /usr/lib/nagios/plugins/check_nrpe -H xx.xx.xx.xx -p 5666 NRPE v2.12 问题是 – 在Nagiospipe理屏幕中查看远程服务器stager ,它显示为“DOWN”。 check_ping命令显示: monitoring_server~: /usr/lib/nagios/plugins/check_ping -H 'xx.xx.xx.xx' -w 5000,100% -c 5000,100% -p 1 PING CRITICAL – Packet loss = 100%|rta=5000.000000ms;5000.000000;5000.000000;0.000000 pl=100%;100;100;0 任何人都可以提供一些方向如何得到这个工作? 不知道还有什么要做
我正在使用Nagios的基本NRPE插件来被动地监视Windows Eventlog。 该插件允许将EventID例外列表作为命令参数。 所以,例如,我可以阻止EventID为1024的任何事件。 当然,这不看事件的来源。 我想知道的是两个来源使用相同的EventID的机会。 一些现场检查(searcheventid)只发现唯一性,所以这可能是一个可以接受的风险,但我希望你的想法。 你有没有遇到过使用相同的EventID的两个来源?
使用NSClient ++(和Icinga)监视SQL Server代理作业的最佳方法是什么? 我们在服务器上有大约100个工作。 如果监控能够处理每个工作的恢复状态,那也不错。
我已经在某些服务器上安装了NRPE和SNMP,因为我想用Nagios监视这个服务器。 我有几个检查已经正常运行,我得到了预期的输出。 今天,我已经安装了check_ifstatus Nagios命令来监视我的一台mysql服务器上的网卡的状态。 在服务器上本地运行check_ifstatus时,我正确地获得了相关信息: [root@dbr4 nagios]# /usr/lib64/nagios/plugins/check_ifstatus -H localhost OK: host 'localhost', interfaces up: 4, down: 0, dormant: 0, excluded: 0, unused: 0 |up=4,down=0,dormant=0,excluded=0,unused=0 [root@dbr4 nagios]# 但是当我从我的Nagios服务器运行命令时出现以下错误: [root@monitorvm ~]# /usr/lib64/nagios/plugins/check_ifstatus -H amadbr4 CRITICAL: No response from remote host 'dbr4' for 1.3.6.1.2.1.2.2.1.8 with snmp version 1 [root@monitorvm ~]# 这是否意味着我必须在我想检查的服务器上启用snmp? 有没有办法使用NRPE来运行此检查? SELINUX在所有机器上都被禁用。
我想用我的Gmail帐户发送Nagios通知。 我已经build立了我想要监视和服务的主机。 在Windows Server 2012安装上使用NagWin完成此操作最简单的方法是什么? 据我所知,我必须改变一些这些configuration设置: # 'notify-host-by-email' command definition define command{ command_name notify-host-by-email command_line /usr/bin/printf "%b" "***** Nagios *****\n\nNotification Type: $NOTIFICATIONTYPE$\nHost: $HOSTNAME$\nState: $HOSTSTATE$\nAddress: $HOSTADDRESS$\nInfo: $HOSTOUTPUT$\n\nDate/Time: $LONGDATETIME$\n" | /bin/blat – -to $CONTACTEMAIL$ -f nagios@localhost -subject "** $NOTIFICATIONTYPE$ Host Alert: $HOSTNAME$ is $HOSTSTATE$ **" -server ??? } # 'notify-service-by-email' command definition define command{ command_name notify-service-by-email command_line […]
我写了一个简单的nagios命令来检查超过1秒的值的变化 #!/bin/bash HOSTNAME=$1 COMMUNITY=$2 OID=$3 WAITTIME=1 echo "/usr/lib/nagios/plugins/check_snmp -H $HOSTNAME -C $COMMUNITY -o $OID" > /tmp/csnmp_comand VAR1=`/usr/lib/nagios/plugins/check_snmp -H $HOSTNAME -C $COMMUNITY -o $OID|cut -d"=" -f2|sed 's/[aZ]//'` /bin/sleep $WAITTIME VAR2=`/usr/lib/nagios/plugins/check_snmp -H $HOSTNAME -C $COMMUNITY -o $OID|cut -d"=" -f2|sed 's/[aZ]//'` CHANGED=`/usr/bin/expr $VAR2 – $VAR1` BPS=`/usr/bin/expr $CHANGED / $WAITTIME` echo "OK $BPS|bps=$BPS" > /tmp/check_snmptest echo "OK $BPS|bps=$BPS" exit […]
我的nagios fail2ban服务失败。 另外一个命令是好的: nagios @ server:/ usr / lib / nagios / plugins $ / usr / local / nagios / libexec / check_nrpe -H 127.0.0.1 -c“check_load” OK – 加载平均值:0.00,0.06,0.08 | load1 = 0.000; 15.000; 30.000; 0; load5 = 0.060; 10.000; 25.000; 0; load15 = 0.080; 5.000; 20.000; 0; 使用fail2ban服务,它不起作用。 这fail2ban脚本testing这个(见http://pastebin.com/1utP9iM6 ): $(ps aux |grep […]