我刚做了一堆Nagios安装。 现在来testing它们。 我想先做的只是快速的完整性检查来validation安装是否正确。 有没有一个快速的方法来触发一个Nagios警报,默认安装,使用dd或类似的填补硬盘短?
我有一些远程站点在几台计算机上运行VNC以支持目的。 他们(显然)只在我们的内部networking上可用。 我正在使用Nagios来跟踪networking中的所有系统,我想检查它以确保VNC服务器在相应的主机上运行。 这里有一个'check_vnc'插件,但它依赖于我不想使用的VNC快照 。 当然我可以使用它,但它增加了更多的复杂性和依赖性,我想避免它。 使用check_tcp来确保我得到正确的响应,例如端口5900,发送连接string,取回帧缓冲信息,似乎比较简单。 我想,我真正的问题是: 什么是适当的VNC通用连接string(我使用UltraVNC和RealVNC)和预期的响应是什么? 如果使用VNC快照和check_vnc更容易,请告诉我。 我无法想象,一串文本不是更容易,更快速,更less带宽密集的监视。
我有Apache的根目录的基本身份validation。 我是这样设置的。 /etc/httpd/conf.d/xxxx.conf <Location /> AuthType Basic AuthUserFile xxxxxxxx AuthName "Restricted Area" Require valid-user </Location> 由于此设置是以root身份进行设置的,因此会覆盖Nagios渲染Nagios无法运行的基本身份validation。 我试图通过做排除Nagios目录 <Location /nagios> Allow from all Satisfy any </Location> 但是,由于需要对Nagios设置进行主持,所以一起禁用了身份validation。 排除Nagios子目录的正确方法是什么?
我刚开始使用Nagios,我喜欢我的团队可以承认问题,但是我还没有find方法来logging用于纠正问题的解决scheme。 是否有一个loggingNagios警报的工具,并提供了一种方法来完成事后和日志解决scheme,以便当有人遇到类似的问题,他们可以引用logging的数据?
Nagios检查通知间隔必须大于等于检查时间间隔,因为如果服务在检查之间返回到UP状态,则可以防止Nagios发出虚假警报通知。 我理解这背后的原因。 我们有许多检查每30分钟运行一次。 这意味着如果检查失败,每次在重试用完后检查服务时只发送一个通知。 我需要的是在检查结束后每隔两分钟就能维持一个值classpipe理员的寻呼机。 我不能这样做,因为下一次通知只会在下一次检查中结束,即在另外30分钟内。 我们旧监控系统的一项function是,一旦检查结果变为“HARD DOWN / CRITICAL”,就立即设置一个新的检查间隔。 这意味着我们可以每隔两分钟重新检查一次(并发送警报),直到警报被人确认或将其状态更改为UP,之后检查间隔将恢复为30分钟。 有没有办法在Nagios上做到这一点? 我有一些关于编写一个事件处理程序的想法,这个事件处理程序在一个检查已经过了HARD DOWN / CRITICAL(通过直接发送一个命令到Nagios)之后将会重新安排一个两分钟的检查。 我想知道是否有其他人也必须做类似的事情? 我正在运行Nagios Core 3.2.3。
我们已经使用了一段时间了,最近决定改变我们如何收到警报。 为此,我们安装了twurl( https://github.com/marcel/twurl )并使用它来发送警报。 不幸的是,这个日志警报已经被发送,但是没有一个到达显示器的twitter帐户。 twurl使用了一个非常标准的CLI,看起来像这样(nagiosmacros保留下来): /usr/local/bin/twurl -d "status=d @$CONTACTEMAIL$ $NOTIFICATIONTYPE$: $TIME$ : $HOSTALIAS$ / $SERVICEDESC$ is $SERVICESTATE$ ($SERVICEOUTPUT$)" /1/statuses/update.xml 这是通知命令: define command { command_name notify-service-by-twurl command_line PATH="/usr/kerberos/bin:/usr/local/bin:/bin:/usr/bin:/home/nagios/bin"; HOME="/home/nagios"; /usr/local/bin/twurl -d "status=d @$CONTACTEMAIL$ $NOTIFICATIONTYPE$: $TIME$ : $HOSTALIAS$ / $SERVICEDESC$ is $SERVICESTATE$ ($SERVICEOUTPUT$)" /1/statuses/update.xml &>/tmp/lastcheck # command_line /bin/echo '/usr/local/bin/twurl -d "status=d @$CONTACTEMAIL$ $NOTIFICATIONTYPE$: $TIME$ : $HOSTALIAS$ […]
目前进行testing我设置服务检查如下: define service{ use generic-service host_name <host> service_description HTTP check_command check_http!-s "blablabla" -f follow } 请注意,页面上不存在string“blablabla”,这仅仅用于testing。 Nagios正在报告 HTTP OK: HTTP/1.1 301 Moved Permanently – 294 bytes in 6.607 second response time Performance Data: time=6.606636s;;;0.000000 size=294B;;;0 但是,如果我直接运行check_http插件,我得到以下内容: <user>@<nagiosbox>:/usr/lib/nagios/plugins# ./check_http -H <host> -s "blablabla" -f follow HTTP CRITICAL: HTTP/1.1 200 OK – string 'blablabla' not found on […]
我一直没有成功尝试让NSClient在closuresWindows防火墙的64位Windows 7计算机上工作。 我已经尝试启动服务,并试图运行“NSClient ++ /testing”。 没有不同。 我运行了Microsoftnetworking监视器3.4,并在端口12489上执行了捕获。每次我从Nagios计算机运行check_nt命令时,都会在命令行上收到“连接被拒绝”,“无法从服务器获取信息”响应。 networking监视器显示从Nagios计算机发送的NSClient计算机上收到的打包。 还有一个repsonse数据包返回。 不幸的是,我不知道如何解释这个回应。 对于那些如此倾斜的人,这里是返回包的内容: 0000 00 27 0E 0D 41 BF 14 DA E9 15 36 7C 08 00 45 00 0010 00 28 0A DB 40 00 80 06 58 18 C0 A8 0B 16 C0 A8 0020 0B 76 30 C9 83 A4 00 00 00 […]
我最近购买了一个不错的7×11 LED显示屏,我想(除其他外)显示我的nagios状态。 为此,我需要查询我的Nagios安装的状态。 从一个远程的Nagios服务器(比如说一个perl脚本)获取一个状态摘要(例如,非正常服务的数量)是什么合适的方式?
我试图使用check_nrpe检查远程服务器,但它不工作,我不知道我错过了什么… # /usr/lib/nagios/plugins/check_nrpe -H XXX -c check_load -a 6,5,4 8,7,6 NRPE: Unable to read output # 远程的服务器系统日志消息: nrpe[18058]: Connection from XX.XX.XX.XX port 16267 nrpe[18058]: Host address is in allowed_hosts nrpe[18058]: Handling the connection… nrpe[18058]: Host is asking for command 'check_load' to be run… nrpe[18058]: Running command: /usr/bin/sudo /usr/lib64/nagios/plugins/check_load -w 6,5,4 -c 8,7,6 nrpe[18058]: Command completed […]