我试图监视OMD Nagios的mssql服务,但迄今为止没有成功。 通讯端口:1433 实例名称如:MSSQL $实例 这是我的支票: check_command check_nt!SERVICESTATE!-l 'MSSQL$$instance' (like you've suggested here http://serverfault.com/questions/517291/monitor-services-with-in-the-service-name-in-icinga-nagios, nagios said: Failed to open service: MSSQL) 我尝试了一些其他的组合: MSSQL \ $$实例(无法打开服务:MSSQL \ $ SQL2012) MSSQL“$$”实例(无法打开服务:MSSQL“$”SQL2012) “MSSQL”$$“instance”(打开服务失败:“MSSQL”$“SQL2012”) 任何build议非常赞赏。 不知道是什么原因造成的问题。 提前致谢。
在本指南中,我不关注设置HA代理或为什么要这样做。 如果你有它,并且想要使用Icinga来正确地监控它,那么下面是你如何去做这件事的一个想法。 所以这是一个潜在的情况: 2个数据中心A和B. 每个数据中心1个HA代理节点 每个HA代理指向每个数据中心A1,A2,B1,B2中的2个Web服务器 这个场景中的Web服务器实际上是一个Web服务端点,并且一个简单的HTTP GET到URL并不能告诉你有关系统的实际健康状况 监测明智的你可以解决你的当前活动节点的外部检查(如pingdom或其他)。 这将有一些影响,虽然: 你不会testing被动节点,这意味着在节点切换之前,你不确定被动节点是否工作 一个节点的失败不会给你一个明确的错误指示 所以这里是一个偏执的人的方法: 我想从外部IP(s),通过HA代理一直监视每个节点,并进入系统捕捉任何故障 我想要对后端服务进行实际的Web服务调用,以validation它是否正常工作 – 如果您正在testing一个正常的Web站点,显然不适用 让我们开始吧
我一直在寻找一个很好的解释,我应该如何从我的自定义Nagios插件返回数据,以确保Nagiosgraph能够parsing它。 有一个地方提出了“CPU使用率98%| c [cpu] = 98%; 80; 95; 0; 100”的格式,而其他地方则表明了这种差异。 但是,我的Nagios似乎并不了解上述格式或任何其他我试过。 我只是想绘制一张图表,将数据点(比如0到100之间的数值)绘制到一个图上。 这方面是否有很好的资源,还有其他人有这方面的基本范例吗? 假设我有两块数据:一个标签(连接)和一个值(250)。 我如何将这个返回给Nagios,让Nagios能够绘制这个graphics? 注意:我在问“nagiosgraph”而不是“nagiosgrapher”。
通过主动检查,可以使用时间段和检查间隔轻松处理常规服务窗口。 你如何处理被动检查?
Nagios从3.5.1升级到4.0.8 我想在nagios支持论坛上提出这个问题,但一个小时后,我没有收到确认电子邮件来设置我的帐户… Nagios似乎作为一个服务运行良好,但networkingCGIs不工作,并没有error.log apache的错误,也没有nagios.log。 我已经检查了权限,并查看了一些有这个embedded式错误的C代码: 哎呦! 错误:无法读取主机和服务状态信息! 以上同样的错误出现在nagios主页左侧的几乎每个菜单上。 nagios.log在启动时看起来像这样,然后停止,从init: [1431102009] Nagios 4.0.8 starting… (PID=27779) [1431102009] Local time is Fri May 08 13:20:09 ADT 2015 [1431102009] LOG VERSION: 2.0 [1431102009] qh: Socket '/usr/local/nagios/var/rw/query.sh' successfully initialized [1431102009] qh: core query handler registered [1431102009] nerd: Channel hostchecks registered successfully [1431102009] nerd: Channel servicechecks registered successfully [1431102009] nerd: Channel […]
我能够使用check_snmp查看VPN隧道是否启动。 其中一个隧道的OID是.1.3.6.1.4.1.9.9.171.1.2.3.1.35.3002962。 当隧道启动时,没有问题。 问题是,当隧道closures时,因为OID消失了。 加工: /usr/lib/nagios/plugins/check_snmp -H 10.10.10.1 -C public -o .1.3.6.1.4.1.9.9.171.1.2.3.1.35.3002962 收益: SNMP OK – 1 | iso.3.6.1.4.1.9.9.171.1.2.3.1.35.300296=1 Tunnel down and OID missing: External command error: Error in packet Reason: (noSuchName) There is no such variable name in this MIB. Failed object: iso.3.6.1.4.1.9.9.171.1.2.3.1.35.30029 有任何想法吗? 更新:看起来我将不得不写我自己的。 隧道的OID改变了,所以使用直接的check_snmp将不起作用。 还是找不到为什么check_asa_vpn添加出错了。
我得到这个check_nrpe SSLL无法完成主服务器握手错误,当我尝试执行下面的命令。 /usr/local/nagios/libexec/check_nrpe -H 10.192.122.234 10.192.122.234 –> nagios client machine 但是当我使用 /usr/local/nagios/libexec/check_nrpe -H localhost 它给出了适当的结果,即使用主服务器IP,它甚至是nrpe版本,而不是本地主机,它给了我nrpe版本的结果。 当我从nagios客户端机器执行相同的命令时,它再次给我nrpe版本。 主服务器IP位于nrpe.cfg文件中。 有关信息,主ip和客户ip都configuration了eth1。 那么问题在哪里,为什么我的主服务器无法在客户机上运行这个命令?
我正在用check_mk和OMD提供的nagios安装方面遇到了很多麻烦。 当使用web guipipe理check_mk时,通知页面显示以下Python错误: Traceback (most recent call last): File "/omd/sites/keck/share/check_mk/web/htdocs/wato.py", line 304, in page_handler modefunc("content") File "/omd/sites/keck/share/check_mk/web/htdocs/wato.py", line 9000, in mode_notifications statename = _(entry.get("HOSTSTATE")[:4]) NameError: global name 'entry' is not defined 对于我的生活,我无法弄清楚这个错误。 我甚至擦拭了我的安装,并尝试从头设置,并得到同样的问题。 有任何想法吗?
我有以下服务configuration捕获SNMP陷阱: define service { name SNMP_TRAP service_description SNMP_TRAP active_checks_enabled 1 ; Active service checks are enabled passive_checks_enabled 1 ; Passive service checks are enabled/accepted parallelize_check 1 ; Active service checks should be parallelized process_perf_data 0 obsess_over_service 0 ; We should obsess over this service (if necessary) check_freshness 0 ; Default is to NOT check service […]
我正在运行Shinken,并有一个包,其中包含几个命令,通过NRPE在受监视的主机上运行bash脚本。 我有一个运行一个bash脚本,需要4个参数的主机检查。 当它只运行我在命令中传递的4个参数中的一个时..cfg将其传递给主机供脚本使用。 我在这个问题上search了很多,一直没有find解决办法。 从我读过的大多数问题中,人们用传递参数向NRPE报告的问题源于没有正确设置“dont_blame_nrpe”,或者没有编译支持参数的nrpe。 这不是我的情况。 dont_blame_nrpe设置为1,模块编译参数支持。 更重要的是,我对同一个主机(在同一个包中设置)进行检查,它只需要一个参数,工作正常。 这里是我的包中的commands.cfg: define command { command_name check_nrpe command_line $PLUGINSDIR$/check_nrpe -u -H $HOSTADDRESS$ -c $ARG1$ -a '$ARG2$ $ARG3$ $ARG4$ $ARG5$' } 我也试着用双引号围绕整个参数和双引号围绕每个单独的参数。 不pipe怎样,我都会得到相同的结果。 服务定义: define service{ service_description check-worker-count use generic-service register 0 host_name nrpe-pack check_command check_nrpe!check-worker-count!worker-name!12!90!80 } 主机上的/etc/nrpe.d/check-worker-count.cfg: command[check-worker-count]=/usr/lib64/nagios/plugins/check_worker_count.sh -n $ARG1$ -p $ARG2$ -w $ARG3$ -c $ARG4$ 我在主机上输出$ *的脚本在一开始就是这样: […]