Articles of Nagios

Nagios前端w / API更改configuration?

我的工作场所曾经使用Monarch(捆绑在基础社区版)。 我构build了一个自定义的CGI,当我们的主机数据库(单独的应用程序)发生变化时,它将更新configuration。 由于基础社区版不再支持,我找不到一个独立的,新版本的Monarch,有没有人有一个免费的Nagiosconfiguration前端/configuration生成器有一个API的build议? 我看了nagiosql。 它没有API,而且它的编写方式使得很难重用其他PHP文件中的代码,我可能会把它放在那里来提供API。 至lessMonarch有一些可重用的模块化代码。

更改Centreon图表所用磁盘空间的y轴刻度

我使用check_nt插件(通过check_nt_disk命令)监视Windows服务器上的磁盘空间使用情况。 这工作得很好,我也得到了一些不错的图表。 图(存储模板)的问题是x轴显示使用的磁盘空间而不是磁盘的总大小,例如: 产生这个数据的检查是有效的: ./check_nt -H 172.16.3.200 -p 12489 -s MyPassword -v USEDDISKSPACE -ld -w 80 -c 90 其中返回到nagios以下(我已经在pipe道字符上的两行分割): d:\ – 总计:19.55 Gb – 已用:3.65 Gb(19%) – 免费15.90 Gb(81%)| 'd:\使用空间'= 3.65Gb; 15.64; 17.59; 0.00; 19.55 我知道总可用磁盘空间正在被logging( 19.55 ),但是我不知道如何调整图表来使用这个作为y轴的比例。 有没有人做过这个? 我正在使用Nagios 3.2.3和Centreon 2.2 stable。 更新: 在回复regilero,这些都是我可用的曲线: 这些都是模板:

监视SQL Server 2008

我知道SQL Server不释放内存,除非操作系统需要它。 然后,监视可用字节(空闲内存)不是监视服务的最佳方式。 还有哪些其他variables可以给我一个关于SQL Server行为的真实度量? 也许页数/秒或页面错误/秒? 我正在使用nagios监视服务,有时会出现警报,因为执行了一个大的查询。

Nagios不接受命令中的正则expression式

我有这个命令定义: define command{ command_name check_http_sane command_line $USER1$/check_http -H $HOSTNAME$ -r "HTTP/1.1 (200|301|302|303|304|307|401|418|426)" } 当我在命令行上手动运行它,它工作正常,但nagios(2.6)报告“找不到模式”错误。 我需要逃避什么吗? 编辑:如下所述,我通过用我自己的脚本replacecheck_http解决了这个问题(对我们的用例来说足够好)。 脚本: http : //pastebin.com/hNmz6Wa1

Nagios创build大量的僵尸进程

在我的监控盒中,我有很多由nagios创build的僵尸进程,他们也很快被删除。 我正在使用主动检查来监视我的服务器。 我积累了使用以下命令创build的已停用的进程: $ top -d 0.25 -b -n 20 > topout.txt 这收集了0.25s的延迟20倍的输出。 我做了grep的topout.txt为已经失效的过程。 $ cat topout.txt | grep defunct 我得到以下输出。 8957 nagios 20 0 0 0 0 Z 6.0 0.0 0:00.02 nagios <defunct> 8951 nagios 20 0 0 0 0 Z 3.0 0.0 0:00.01 nagios <defunct> 8954 nagios 20 0 0 0 0 Z […]

使用Nagios事件处理程序将系统恢复到正确的状态

我很新的监测,configurationpipe理等,所以请裸露在我身边。 我已经阅读了像Ansible和SaltStack这样的configurationpipe理/configuration工具。 这些对我来说听起来不错,我打算使用其中的一个(还没有决定哪一个我倾向于Ansible)。 理想情况下,我想使用这两者来控制系统中的configuration和命令执行的所有方面。 即:从最初的引导,特别的命令,而且当系统范围的exception发生时。 为此,我似乎可以使用Nagios事件处理程序(正确设置时)依次执行已configuration好的剧本(或者等价的盐水图)来尝试将系统恢复到正确的状态。 这个设置是否经常被使用? 任何理由,这不是一个好主意? 我在问,因为在1个工具(ansible或saltstack)下configuration所有configuration似乎合乎逻辑/方便,但是如上所述使用Nagios(或类似的)和Ansible(或类似的)的组合信息似乎是真的稀疏/ 不存在的。 谢谢。

DELL OpenManage 7.3在ESXi5.1上

我在ESXi5.1主机上安装了Dell OpenManage 7.3 VIB。 我认为VIB会将所有DELL特定的MIB加载到OS中。 我也在该主机上启用了snmpd,但是当我在做“snmpwalk”或“snmpget”时,我无法获取有关Dell特定OID的信息 VIB的来源: DELL OpenManage 7.3 VIB 我得到的输出: nmpget -v2c -c public myesxi.domain.com 1.3.6.1.4.1.674.10892.1.300.10.1.8.1 SNMPv2-SMI::enterprises.674.10892.1.300.10.1.8.1 = No Such Object available on this agent at this OID 我确实从VMWare堆栈获取OID,但不是戴尔的。 最终我想使用nagios插件“check_openmanage”,但它显然给我一个错误,因为它不能查询戴尔OID的 我错过了什么吗? 编辑:我看到包安装: # esxcli software vib list | grep -i "OpenManage" OpenManage 7.3-0000 Dell PartnerSupported 2013-08-21

在nagios参数中embedded空白

我创build了我自己的nagios命令 $USER1$/check_http -H $HOSTNAME$ -p $ARG1$ -u $ARG2$ -e $ARG3$ -w 5 -c 10 -4 由新服务使用。 当$ARG3$包含一些空格(例如“200 OK”)时,服务失败报告“名称或服务未知”。 如下面的命令行一样: check_http -H 1.1.1.1 -u /xxx/1234.pdf -w 5 -c 10 -e 200 OK Name or service not known 我怎样才能以某种方式引用白色空间?

HP MSA 2312 XML API“未经授权访问请求”

我正在尝试编写一个定制的Nagios插件来通过HTTP XML API监视HP MSA2312fc。 我可以通过/ api / login / {login_hash}成功login到系统,但在尝试获取某些数据时(例如,通过/ api / show / system),总会得到错误“未经授权的访问请求”。 我已经尝试了不同的MSA上的命令,但它总是相同的错误。 # Successful login <?xml version="1.0" encoding="UTF-8" standalone="yes"?> <RESPONSE> <OBJECT basetype="status" name="status" oid="1"> <PROPERTY name="response-type">success</PROPERTY> <PROPERTY name="response-type-numeric">0</PROPERTY> <PROPERTY name="response">deb9b907d11459757af645bd859e01aa</PROPERTY> <PROPERTY name="return-code">1</PROPERTY> </OBJECT> </RESPONSE> # Error <?xml version="1.0" encoding="UTF-8" standalone="yes"?> <RESPONSE> <OBJECT basetype="status" name="status" oid="1"> <PROPERTY name="response-type">error</PROPERTY> <PROPERTY name="response-type-numeric">1</PROPERTY> <PROPERTY name="response">Unauthorized […]

NRPE允许使用IPv6进行名称parsing

在CentOS 6.7服务器上从EPEL安装的Nagios 3.5.1监控完全支持IPv6双协议栈的networking。 受监控的主机运行NRPE代理程序,所有这些代理程序都被configuration为作为守护程序(不通过xinetd)与configuration行一起运行 allowed_hosts=bombur.example.com 其中bombur.example.com是Nagios服务器的FQDN,它在DNS中parsing为IPv4和IPv6地址: % host bombur bombur.example.com has address 192.0.2.28 bombur.example.com has IPv6 address 2001:db8:f00:ba8::28 这对在2.15之前运行NRPE版本的主机来说很好,它们缺lessIPv6支持,并且接受IPv4连接。 但是,在支持IPv6的NRPE 2.15主机上,来自Nagios服务器的连接将被拒绝,并显示日志消息: nrpe[21665]: Host 2001:db8:f00:ba8::28 is not allowed to talk to us! 显然, allowed_hosts=<hostname>指令只允许给定主机的IPv4地址,而不允许其IPv6地址。 这个演绎是否正确? 有没有解决这个问题的方法,最好不要在所有NRPE代理configuration中硬编码数字IPv6地址?