Nagios 服务器 Gind.cn

omd nagios监视servicestate mssql /无法打开服务

我试图监视OMD Nagios的mssql服务，但迄今为止没有成功。通讯端口：1433 实例名称如：MSSQL $实例这是我的支票： check_command check_nt!SERVICESTATE!-l 'MSSQL$$instance' (like you've suggested here http://serverfault.com/questions/517291/monitor-services-with-in-the-service-name-in-icinga-nagios, nagios said: Failed to open service: MSSQL) 我尝试了一些其他的组合： MSSQL \ $$实例（无法打开服务：MSSQL \ $ SQL2012） MSSQL“$$”实例（无法打开服务：MSSQL“$”SQL2012） “MSSQL”$$“instance”（打开服务失败：“MSSQL”$“SQL2012”）任何build议非常赞赏。不知道是什么原因造成的问题。提前致谢。

如何使用CentOS 6中的Icinga / Nagios通过HA代理监控networking服务器节点

在本指南中，我不关注设置HA代理或为什么要这样做。如果你有它，并且想要使用Icinga来正确地监控它，那么下面是你如何去做这件事的一个想法。所以这是一个潜在的情况： 2个数据中心A和B. 每个数据中心1个HA代理节点每个HA代理指向每个数据中心A1，A2，B1，B2中的2个Web服务器这个场景中的Web服务器实际上是一个Web服务端点，并且一个简单的HTTP GET到URL并不能告诉你有关系统的实际健康状况监测明智的你可以解决你的当前活动节点的外部检查（如pingdom或其他）。这将有一些影响，虽然：你不会testing被动节点，这意味着在节点切换之前，你不确定被动节点是否工作一个节点的失败不会给你一个明确的错误指示所以这里是一个偏执的人的方法：我想从外部IP（s），通过HA代理一直监视每个节点，并进入系统捕捉任何故障我想要对后端服务进行实际的Web服务调用，以validation它是否正常工作 – 如果您正在testing一个正常的Web站点，显然不适用让我们开始吧

nagiosgraph需要什么数据从我的插件？

我一直在寻找一个很好的解释，我应该如何从我的自定义Nagios插件返回数据，以确保Nagiosgraph能够parsing它。有一个地方提出了“CPU使用率98％| c [cpu] = 98％; 80; 95; 0; 100”的格式，而其他地方则表明了这种差异。但是，我的Nagios似乎并不了解上述格式或任何其他我试过。我只是想绘制一张图表，将数据点（比如0到100之间的数值）绘制到一个图上。这方面是否有很好的资源，还有其他人有这方面的基本范例吗？假设我有两块数据：一个标签（连接）和一个值（250）。我如何将这个返回给Nagios，让Nagios能够绘制这个graphics？注意：我在问“nagiosgraph”而不是“nagiosgrapher”。

在Nagios / Icinga中处理被动检查服务窗口的最佳实践

通过主动检查，可以使用时间段和检查间隔轻松处理常规服务窗口。你如何处理被动检查？

Nagios服务正在运行，网站错误：无法读取主机和服务状态信息

Nagios从3.5.1升级到4.0.8 我想在nagios支持论坛上提出这个问题，但一个小时后，我没有收到确认电子邮件来设置我的帐户… Nagios似乎作为一个服务运行良好，但networkingCGIs不工作，并没有error.log apache的错误，也没有nagios.log。我已经检查了权限，并查看了一些有这个embedded式错误的C代码：哎呦！错误：无法读取主机和服务状态信息！以上同样的错误出现在nagios主页左侧的几乎每个菜单上。 nagios.log在启动时看起来像这样，然后停止，从init： [1431102009] Nagios 4.0.8 starting… (PID=27779) [1431102009] Local time is Fri May 08 13:20:09 ADT 2015 [1431102009] LOG VERSION: 2.0 [1431102009] qh: Socket '/usr/local/nagios/var/rw/query.sh' successfully initialized [1431102009] qh: core query handler registered [1431102009] nerd: Channel hostchecks registered successfully [1431102009] nerd: Channel servicechecks registered successfully [1431102009] nerd: Channel […]

Nagios Core来监视Cisco VPN隧道

我能够使用check_snmp查看VPN隧道是否启动。其中一个隧道的OID是.1.3.6.1.4.1.9.9.171.1.2.3.1.35.3002962。当隧道启动时，没有问题。问题是，当隧道closures时，因为OID消失了。加工： /usr/lib/nagios/plugins/check_snmp -H 10.10.10.1 -C public -o .1.3.6.1.4.1.9.9.171.1.2.3.1.35.3002962 收益： SNMP OK – 1 | iso.3.6.1.4.1.9.9.171.1.2.3.1.35.300296=1 Tunnel down and OID missing: External command error: Error in packet Reason: (noSuchName) There is no such variable name in this MIB. Failed object: iso.3.6.1.4.1.9.9.171.1.2.3.1.35.30029 有任何想法吗？更新：看起来我将不得不写我自己的。隧道的OID改变了，所以使用直接的check_snmp将不起作用。还是找不到为什么check_asa_vpn添加出错了。

check_nrpe ssl无法完成握手，在主服务器和客户端服务器，它都能正常工作

我得到这个check_nrpe SSLL无法完成主服务器握手错误，当我尝试执行下面的命令。 /usr/local/nagios/libexec/check_nrpe -H 10.192.122.234 10.192.122.234 –> nagios client machine 但是当我使用 /usr/local/nagios/libexec/check_nrpe -H localhost 它给出了适当的结果，即使用主服务器IP，它甚至是nrpe版本，而不是本地主机，它给了我nrpe版本的结果。当我从nagios客户端机器执行相同的命令时，它再次给我nrpe版本。主服务器IP位于nrpe.cfg文件中。有关信息，主ip和客户ip都configuration了eth1。那么问题在哪里，为什么我的主服务器无法在客户机上运行这个命令？

check_mk：全局名称“entry”未定义

我正在用check_mk和OMD提供的nagios安装方面遇到了很多麻烦。当使用web guipipe理check_mk时，通知页面显示以下Python错误： Traceback (most recent call last): File "/omd/sites/keck/share/check_mk/web/htdocs/wato.py", line 304, in page_handler modefunc("content") File "/omd/sites/keck/share/check_mk/web/htdocs/wato.py", line 9000, in mode_notifications statename = _(entry.get("HOSTSTATE")[:4]) NameError: global name 'entry' is not defined 对于我的生活，我无法弄清楚这个错误。我甚至擦拭了我的安装，并尝试从头设置，并得到同样的问题。有任何想法吗？

为什么我的被动支票没有处理？

我有以下服务configuration捕获SNMP陷阱： define service { name SNMP_TRAP service_description SNMP_TRAP active_checks_enabled 1 ; Active service checks are enabled passive_checks_enabled 1 ; Passive service checks are enabled/accepted parallelize_check 1 ; Active service checks should be parallelized process_perf_data 0 obsess_over_service 0 ; We should obsess over this service (if necessary) check_freshness 0 ; Default is to NOT check service […]

NRPE检查参数丢失

我正在运行Shinken，并有一个包，其中包含几个命令，通过NRPE在受监视的主机上运行bash脚本。我有一个运行一个bash脚本，需要4个参数的主机检查。当它只运行我在命令中传递的4个参数中的一个时..cfg将其传递给主机供脚本使用。我在这个问题上search了很多，一直没有find解决办法。从我读过的大多数问题中，人们用传递参数向NRPE报告的问题源于没有正确设置“dont_blame_nrpe”，或者没有编译支持参数的nrpe。这不是我的情况。 dont_blame_nrpe设置为1，模块编译参数支持。更重要的是，我对同一个主机（在同一个包中设置）进行检查，它只需要一个参数，工作正常。这里是我的包中的commands.cfg： define command { command_name check_nrpe command_line $PLUGINSDIR$/check_nrpe -u -H $HOSTADDRESS$ -c $ARG1$ -a '$ARG2$ $ARG3$ $ARG4$ $ARG5$' } 我也试着用双引号围绕整个参数和双引号围绕每个单独的参数。不pipe怎样，我都会得到相同的结果。服务定义： define service{ service_description check-worker-count use generic-service register 0 host_name nrpe-pack check_command check_nrpe!check-worker-count!worker-name!12!90!80 } 主机上的/etc/nrpe.d/check-worker-count.cfg： command[check-worker-count]=/usr/lib64/nagios/plugins/check_worker_count.sh -n $ARG1$ -p $ARG2$ -w $ARG3$ -c $ARG4$ 我在主机上输出$ *的脚本在一开始就是这样： […]

Intereting Posts

如何通过SSH远程安装Linux？ WMI性能Adapater服务器错误基准MS SQL Server 2008 内存256GB的Linux / 48内核 – 机器开始宕机/窒息，剩下大量的内存什么是正确的方式来观看和重新加载Nginx的conf？ nginx根据url slug重写到同一域下的另一台服务器 OpenVPN内部IP调用 Debian 6.0.3，Freeradius 2.1.10，PostgreSQL 8.4高内存使用 Apache / nginx：固定客户端证书和FastCGI 无法连接到DigitalOcean的MySQL服务器圆形目录结构 Apache – 从文档根目录服务目录，不需要放入文档根目录 hdparm使用正确的密码编码解锁ssd 与恶意软件共享主机，.htaccess文件每2小时左右修改一次 Amazon CloudFront CORS特定的延迟

Articles of Nagios