Articles of Nagios

Nagios NRPE插件check_ad – 修正

我已经读了这个问题很多,试图用我自己的方式解决这个问题,但仍然不是运气。 我已经运行debian 7作为nagios服务器。 问题是,我不能检查我的活动目录域控制器(Win Server 2003)的状态通过这个插件基于nrpe扫描 – https://www.itefix.no/i2/check_ad 192.168.1.12 – 我的域控制器 win服务器上的NRPE正在正常工作并正确收听: root@nagios:~ > check_nrpe -u -H 192.168.1.12 -p 5666 I (0,4,1,102 2013-07-15) seem to be doing fine… 但是当我尝试通过插件检查AD失败,出现此错误: root@nagios:~ > check_nrpe -u -H 192.168.1.12 -p 5666 -c check_ad No handler for command: check_ad 顺便说一句:我成功地从win服务器直接运行这个命令: 这里是我的NSClient ++configuration(我启用了外部脚本检查): C:\ Program Files \ NSClient ++ \ nsclient.ini […]

通过Nagios识别戴尔EquilLogic

编辑:所有固件和模型是兼容的,这就是为什么没有发布关于它。 好的,这里会有很多,请耐心等待。 我已经在这里工作了几个小时(阅读手册等),所以我不只是来这里的权利出来的蓝色。 我正在使用一个现有的Nagios服务器,其中有几个其他现有的插件和检查运行和工作。 现在我想添加另一台服务器来检查,所以我做了以下修改: 首先,我添加了一个名为:check_equallogic.sh的/ usr / local / nagios / libexec文件。 权限是755,和其他所有一样。 我已经看到了纳吉奥斯:纳吉奥斯,并在列表中显示它为Nagios的所有者。 然后,我在\ usr \ local \ nagios \ etc \ objects中的commands.cfg文件中添加了一个命令,显示以下内容: # 'check_equallogic' command definition define command{ command_name check_equallogic command_line $USER1$/check_equallogic -H $HOSTADDRESS$ -C $ARG1$ -t $ARG2$ $ARG3$ } 在这之后,我在对象目录中创build了一个名为equallogic.cfg的文件,它包含(或多或less): define host{ use linux-server ; Inherit default values from a template […]

为什么snmptt没有翻译这个陷阱?

我有一个发送snmp v1陷阱的设备,snmptt无法翻译它们。 要抓取陷阱的副本,我停止了snmptt服务,并将陷阱复制到/ tmp。 我试图触发的OID是: .1.3.6.1.4.1.476.1.42.3.2.1.15 这是来自/var/spool/snmptt的原始陷阱: <UNKNOWN> UDP: [10.108.64.250]:4999->[170.6.78.54] .1.3.6.1.2.1.1.3.0 1:7:58:27.81 .1.3.6.1.6.3.1.1.4.1.0 .1.3.6.1.4.1.476.1.42.3.3.0.0.2 .1.3.6.1.4.1.476.1.42.3.2.3.1.1.19 19 .1.3.6.1.4.1.476.1.42.3.2.3.1.2.19 .1.3.6.1.4.1.476.1.42.3.2.1.15 .1.3.6.1.4.1.476.1.42.3.2.3.1.3.19 1:7:58:27.79 .1.3.6.1.6.3.18.1.3.0 10.108.64.250 .1.3.6.1.6.3.18.1.4.0 "public" .1.3.6.1.6.3.1.1.4.3.0 .1.3.6.1.4.1.476.1.42.3.3.0 以下是来自snmpttunknown.log的条目: Thu Jul 10 14:32:05 2014: Unknown trap (.1.3.6.1.4.1.476.1.42.3.3.0.0.2) received from 10.108.64.250 at: Value 0: 10.108.64.250 Value 1: 10.108.64.250 Value 2: 1:5:34:06.89 Value 3: .1.3.6.1.4.1.476.1.42.3.3.0.0.2 Value 4: 10.108.64.250 Value […]

NRPE(Winrpe)Powershell命令 – 无法读取Nagios中的输出

我试图从NRPE.cfg运行Powershell脚本,并在Nagios中获得输出。 当我在本地(Windows)服务器上运行脚本时,一切都很好。 但是,当我把它放在NRPE.cfg EN尝试获得输出在Nagios,我得到一个无法读取输出错误。 search互联网,但无法find解决scheme,所以也许你可以帮助我.. 命令/脚本是: 命令[check_veeam_dailyone] = cmd / c echo c:\ install \ veeam_check.ps1; 退出($ lastexitcode)| powershell.exe -ExecutionPolicy绕过-noninteractive -noprofile -File – 当我把这个在PowerShell的Windows服务器上,我会得到这个输出: PS C:\ Install> OK – 工作:VeeamOne_Daily在10/09/2014 04:45:51成功完成。 “PS C:\ Install>”部分很奇怪,但它确实读取了上一份工作,所以看起来“没问题”。 但是当我尝试在Nagios中获得这个输出时: root @ nagios:〜#/ usr / lib / nagios / plugins / check_nrpe -H 192.168.1.1 -t 300 -c check_veeam_dailyone 它说: NRPE:无法读取输出 […]

Nagios的check_ntp_time零星套接字超时

Check_ntp_time在我的所有主机上偶尔失败。 我通常收到 CRITICAL – Socket timeout after 10 seconds 几分钟后,check_ntp_time成功并显示正确的偏移量 NTP OK: Offset 0.0001899003983 secs 我已经尝试提高check_ntp_time命令超时到20秒,但它以相同的速度失败。 我尝试从ntp.conf中删除nopeer和noquery无济于事(这是有道理的,因为如果这是问题,它将失败100%的时间)。 事实上,这是随机的失败和成功的后果真的把我扔掉了。 值得注意的是,它并不是所有主机同时出现故障,一次只能在1到3个主机之间出现故障。 任何想法可能是什么原因造成的? 我的check_ntp_time命令如下所示: define command{ command_name check_ntp_time command_line $USER1$/check_ntp_time -H pool.ntp.org -t 20 -w 1 -c 3 } 编辑: 公制最小。 最大。 平均 检查执行时间:0.00秒20.00秒1.153秒 检查延迟:0.00秒0.00秒0.000秒 状态变化百分比:0.00%31.84%0.86% 每秒2次检查(每个CPU 0.5次)

Nagios通知间隔和第一个通知延迟

我曾经在Nagios中使用过这两个参数(first_notification_delay,notification_interval),直到现在为我完美工作。 现在我已经添加了使用nrpe命令的新检查。 上述两个参数不受影响。 我每隔十​​分钟就会收到一封电子邮件。 我必须改变主机nsclinet.cfg文件上的任何东西吗? 我正在使用的服务定义是 define service { use generic-win-logfile host_name RuleS_TI_E405,RuleS_TI_E464 service_description check_logfilesSmsDispatcher_Process check_command check_nrpe!check_logfilesSmsDispatcher_Process } 它embedded了以下服务模板: define service{ name generic-win-logfile active_checks_enabled 1 passive_checks_enabled 0 parallelize_check 1 obsess_over_service 1 check_freshness 0 notifications_enabled 1 event_handler_enabled 1 process_perf_data 0 retain_status_information 1 retain_nonstatus_information 1 is_volatile 1 check_period 24×7 max_check_attempts 3 normal_check_interval 10 ; check every 5 […]

Nagios,nginx和外部命令 – 未经授权

所以我们要从Nagios 3到Nagios 4,因为我们在主机上已经有点落后了,所以我们想要重新开始。 我去的设置是: Debian Jessie Nagios 4.1.1 丁香configuration Nginx作为networking服务器 现在,我已经完美地工作了。 我遇到的唯一问题是外部命令。 我以nagiosadmin身份login: External Command Interface Last Updated: Wed Dec 2 21:51:50 CET 2015 Nagios® Core™ 4.1.1 – www.nagios.org Logged in as nagiosadmin 但是,我收到这个消息: 对不起,您没有权限提交指定的命令。 我的cgi.cfg: physical_html_path=/usr/local/nagios/share url_html_path=/nagios use_authentication=1 default_user_name=nagiosadmin authorized_for_system_information=nagiosadmin authorized_for_system_commands=nagiosadmin authorized_for_configuration_information=nagiosadmin authorized_for_all_hosts=nagiosadmin authorized_for_all_host_commands=nagiosadmin authorized_for_all_services=nagiosadmin authorized_for_all_service_commands=nagiosadmin default_statusmap_layout=5 default_statuswrl_layout=4 refresh_rate=90 ping_syntax=/bin/ping -n -U -c 5 […]

从Nagios4到电报的通知

无法从我的nagios获取警报。 服务器在Debian上。 从github.com/vysheng/tg安装电报 Nagios4的configuration文件。 commands.cfg: #'notify-service-by-tg' command definition define command{ command_name notify-service-by-tg command_line /home/nagios/tg/bin/telegram-cli -WR -U root -D -e 'msg $_CONTACTTG$ $NOTIFICATIONTYPE$ Host : $HOSTNAME$ – Service : $SERVIC$ } #'notify-host-by-tg' command definition define command{ command_name notify-host-by-tg command_line /home/nagios/tg/bin/telegram-cli -WR -U root -D -e 'msg $_CONTACTTG$ "$NOTIFICATIONTYPE$ Host : $HOSTNAME$ is $HOSTSTATE$ @ $ } […]

Check_MK:我如何根据服务组创build通知,而不仅仅是一个服务?

我希望能够根据一组服务的可用性创build通知,而不仅仅是一个阈值。 例如,假设我有10台AWS服务器都做同样的事情,而且我希望其中的一些服务器有时会超载/失败,而不会损害应用程序:我希望Check_MK通知我,如果10个服务器中有3个(或更高)在给定的服务中失败。 如果失败了,不要通知我。 另一个例子,也许更简单:假设你在同一台NFS服务器上有20台服务器上的NFS挂载点。 我不想得到20个警告或批评。 上述在我的环境中的例子已经分组在服务组。 我在Check_MK 1.2.6p16中尝试了三种不同的机制: 使用商业智能。 分组和警告设置是太棒了,它做了我想要的! 但是通知规则不允许任何与产品的BI组件有关的任何事情! 群集 – 我为AWS服务器设置了一个群集,但是由于我的一些检查(最主要是我的HTTP活动检查)需要一个主机名,这没有任何帮助。 我不认为Cluster是一个正确的拉比博士,但是如果我错了,请纠正我的错误。 我放弃了看这个。 服务组警示 – 这个原始问题的目的。 通知逻辑中没有任何东西可以让我警告服务组的可用性。 任何人用Check_MK完成这个?

使用Nagios检查当前在远程系统上login的用户

在Nagios中,有一个check_users函数来检查login到本地系统的用户数量,但是对于远程系统我该怎么做呢? 我试图find合适的插件失败。