我有一个奇怪的问题:Icinga(nagios)不运行我在debian框中设置的check_nt 。 我所做的是安排NSClient_version和PING的强制检查。 如果我查看日志文件,我可以看到两个命令都计划运行: [1372774536] EXTERNAL COMMAND: SCHEDULE_FORCED_SVC_CHECK;sqlnota03.dbb.dk;NSClient_version;1372781738 [1372774536] EXTERNAL COMMAND: SCHEDULE_FORCED_SVC_CHECK;sqlnota03.dbb.dk;PING;1372781738 打开debugging之后,我得到这个: [1372774536.502948] [016.2] [pid=3840] Found another service check event for service 'NSClient_version' on host 'sqlnota03.dbb.dk' @ Tue Jul 2 17:47:21 2013 [1372774536.502973] [016.2] [pid=3840] Keeping original service check event (ignoring the new one). 我经历了很多次configuration,找不到任何错误,Icinga报告说运行icinga -v <icinga.cfg>时configuration正常。 有没有人可以发现我做错了什么? configuration是: define host { use windows-server […]
很简单的问题:我怎样才能在Nagios中重新发送通知,以便不改变状态? 我想用它来伪造短信。 服务总是OK(整个脚本内容是退出0),我希望每天通知它。
我正在尝试使用Icinga来监视特定string的网站。 当我从命令行运行插件时,它似乎工作正常,但在Icinga-Web中,无论我input什么string,总是显示成功。 #Doesn't Work – always returns ok define service { host_name mywebserver service_description Check Website servicegroups Websites check_command check_http!-s "no such string" -H www.mysite.com -u /apath/ -t 7 use generic-service notification_interval 60 ; set > 0 if you want to be renotified } 奇怪的是,如果我运行插件位于/ usr / lib / nagios /插件/ check_http如下,它给了我我所期望的: ./check_http -H www.mysite.com […]
我使用yum在CentOS上安装并configuration了nagios 我在Web界面上看到“ It appears as though you do not have permission to view information for any of the hosts you requested… ”。 我已经创build了passwd文件,并检查了nagiosadmin在cgi.cfg文件中有权限。 但是,在Web界面上,即使我以nagiosadmin身份login,页面显示“ Logged in as $REDIRECT_REMOTE_USER=login”。 有任何想法吗? [编辑]我刚从源码编译无效[/编辑] [EDIT2] ScriptAlias /nagios/cgi-bin "/usr/local/nagios/sbin" <Directory "/usr/local/nagios/sbin"> # SSLRequireSSL Options ExecCGI AllowOverride None Order allow,deny Allow from all # Order deny,allow # Deny from all # […]
我有一个完美的工作到几天前的一个nagios服务器。 我已经停止了它,并重新启动它来增加它的内存,从那时起,服务器上的iowait急剧增加(超过20%,这个数字还不到1%)。 我试图把服务器上原始数量的内存,但我仍然得到同样的问题。 我已经在serverfault上发现了很多类似的iowait问题,但我从来没有设法find解释我的情况: 看着iotop,我看到有很多的pdflush,这是做页面caching&kjournald,专门用于日记ext3文件系统的io。 我不知道是否正常 根据其他serverfault问题,我试图把noatime在fstab。 Ext3文件系统以有序数据模式安装 Total DISK READ: 0.00 B/s | Total DISK WRITE: 210.44 K/s TID PRIO USER DISK READ DISK WRITE SWAPIN IO> COMMAND 650 be/3 root 0.00 B/s 0.00 B/s 0.00 % 99.99 % [kjournald] 11482 be/4 root 0.00 B/s 0.00 B/s 0.00 % 98.42 % [pdflush] 12167 be/4 […]
我需要使用Nagios检查电源设备Cisco 7604的状态。 我决定使用插件check_snmp: /usr/local/libexec/nagios/check_snmp -H 192.168.150.200 -o 1.3.6.1.4.1.9.9.91.1.1.1.1.4.13 SNMP OK – 1 | iso.3.6.1.4.1.9.9.91.1.1.1.1.4.13=1 其中: #show environment alarm threshold environmental alarm thresholds: power-supply 1 fan-fail: OK threshold #1 for power-supply 1 fan-fail: (sensor value != 0 ) is system minor alarm 如何为Nagios设置CRITICAL(CRITICAL = 0,OK = 1)?
就像标题一样,如果一个服务连续失败10分钟以上,我想接收来自nagios的警报。 我必须改变哪个macros或参数? 我在Debian 6和我的nagios版本是3.2.1
是否有任何好的插件来生成像Nagios一样的报告,如CPU,一个月内存使用情况等。 我已经在使用Nagiosgraph了。 任何方式导出数据的月份,年份等?
我正在使用Icinga(Nagios fork)来监视〜10个web服务器,每个服务器都提供不同的服务。 现在我想提供关于我们公司内部网上的服务器状态的汇总视图,提供如下信息: server | state | last downtime | Ø uptime (month) | Ø uptime (year) Srv1 | OK | 2013-10-09 | 99,5% | 99,8 % Srv2 | ERROR | 2013-10-31 | 73,1% | 85,4 % 有没有可能从icinga获得这些价值?
我有两个Nagios(monitorA和monitorB)服务器在不同的数据中心。 在两个我已经configuration相同的WWW主机。 这工作正常,直到有一个Nagios主机和WWW服务器之间的networking问题。 当networking问题发生时,我充斥着关于WWW主机不可用的误报。 问题 – 是否有解决某种分布式监测? 例如,如果监视器A和WWW服务器之间存在networking问题,则通知将不会被发送,直到监视器B上出现同样的问题? 在此先感谢您的帮助。