我有Nagios运行和snmp监控设备。 我需要监视Linux服务器接口的带宽使用情况,并在使用率低于100kbps时发送警报。 有没有任何插件来做到这一点? 我发现的所有插件都是opossite情况:高带宽使用情况时警报。 snmp很重要。 谢谢 !
我有以下ntp通过NRPE检查我的服务器上的Nagios /usr/local/nagios/nrpe_plugins/check_ntp_time -H localhost -w 0.5 -c 1 -q 通过date命令手动将date更改为过去的date时: date –set="16 JAN 2017 15:00:00" 检查总是给出一个OK状态输出 NTP OK: Offset -1.442432404e-05 secs|offset=-0.000014s;0.500000;1.000000; 尽pipe抵消了 remote refid st t when poll reach delay offset jitter ============================================================================== 10.7.100.65 176.58.109.199 3 u 4971 64 7 0.246 6136468 4339138 10.8.100.65 188.114.116.1 3 u 4971 64 7 1.571 6136468 4339138 10.7.91.41 217.114.59.66 […]
我试图监视一个服务器上的目录,文件的数量可以每天都有所不同。 这个服务器本身在Nagios3上监控得很好。 但是,如果我要计算一个目录中的文件数,例如d:\david\ ,它们都是XML文件。 纳吉奥斯能做到这一点,如果是的话,我会怎么做呢? 对纳吉奥斯来说,我很新鲜,但我仍然对此深感自豪。
我已经安装了Nagios来监视我的Debian服务器上的apt。 问题是,我不明白为什么它显示本地服务器上的更新的可用数量也为networking服务器。 例如,我有一个服务器有32个软件包来更新,但我收到一个2的电子邮件警报。 服务configuration: define service { hostgroup_name apt-servers service_description APT check_command check_apt use generic-service notification_interval 0 ; set > 0 if you want to be renotified } 主机configuration define hostgroup { hostgroup_name apt-servers alias APT servers members vps1, vps2, vps3 } 命令configuration从Debian软件包(未触及) # 'check_apt' command definition define command{ command_name check_apt command_line /usr/lib/nagios/plugins/check_apt } # […]
有没有任何工作的graphics工具,以生成用户提供的地图坐标主机的nagios? 还是有任何简单的方法来执行脚本或手动?
我有几个运行常见服务的服务器(apache,imap,pop,smtp,ftp,ssh,svn等),并希望监视它们的可用性。 特别是,如果其中一项重要服务死亡,我希望得到提醒(电子邮件和/或短信),并且如果可能的话,获得有关每项服务的一些基本统计信息(连接数,处理电子邮件数量,垃圾邮件比率等)。 )。 这个工具将被我们用来获得实时的状态和警报,而我们的客户则希望了解正在发生的事情。 我可以自己构build一个简单的Web应用程序(“ping”服务,以查看它们是否还活着),或者我也可以使用一个完整的监控工具(例如nagios,但有点矫枉过劳)?我相信在两者之间存在一些符合我需求的东西。 有什么build议? 如果可能的话,理想的解决scheme将是免费的,易于安装在远程服务器上(即使在同一个子网中也是如此),并且如果可能的话,还有一个可爱的界面;)。
Nagios我有一个非常奇怪的问题。 由于某种原因,check_apt似乎失败了,我不知道为什么。 它的行为就像没有运行检查。 我有nrpe运行在箱子开发和所有其他检查运行良好。 在安装了nagios的盒子上,定义如下。 define service{ use generic-service host_name development service_description APT check_command check_nrpe!check_apt } 在“开发”nrpe.cfg包含以下行。 command[check_apt]=/usr/lib/nagios/plugins/check_apt -n 此外,如果我在安装Nagios的盒子上,并执行以下操作! /usr/lib/nagios/plugins/check_nrpe -H development -c check_apt 哪个返回 APT OK: 0 packages available for upgrade (0 critical updates). 那么,这里有什么不对? 看起来其他NRPE插件工作正常,只有APT似乎失败,并手动运行在框中似乎工作。 build议?
我有一个通过check_by_ssh调用的Nagios check_log风格的perl脚本。 日志文件条目可以包含'>'和'$'等字符,这些字符在SERVICEOUTPUT或LONGSERVICEOUTPUT中是危险的,不允许的。 输出是剥离这些字符使警报难以阅读。 是否有一个解决方法来转义SERVICEOUTPUT中的字符,或select这个危险的活动?
我正在使用安装在RHEL服务器上的MRTG监视Juniper路由器。 “monitor interfaces int_name”命令显示的当前input/输出stream量与路由器MRTG html页面中显示的stream量不匹配。 当路由器的input/输出值超过125Mbps时,不匹配开始。 任何人都可以请指导任何参数,我需要调整以获得正确的值? 谢谢。
我正在尝试将电子邮件警报添加到现有的Nagios安装中。 我一直在使用Web界面来关注一些非关键系统几个月,并且运行良好; 警告和关键问题被发现没有问题。 我的下一个步骤是启用警报function,但即使摆弄了几个小时,我仍然无法获得最简单的警报。 对于可能出现什么问题,我完全没有想法。 这几乎肯定是一件简单的事情,我只是没有接受,所以希望你们中的一个能轻松地发现。 我正在testing的命令很简单。 最初我只是想写一个文件: define command{ command_name alerter command_line echo "Alerter command fired by Nagios" >> /usr/local/nagios/var/alerter.log } 我已经testing了nagios用户可以使用sudo执行这个命令。 一切似乎都好。 主机和服务都是指“pipe理员”联系人组。 这些是他们使用的模板,他们都没有覆盖任何这些设置。 define host{ name generic-host notifications_enabled 1 event_handler_enabled 1 flap_detection_enabled 1 failure_prediction_enabled 1 process_perf_data 1 retain_status_information 1 retain_nonstatus_information 1 check_period 24×7 check_interval 1 retry_interval 1 max_check_attempts 10 check_command check-host-alive notification_period […]