我只是从Nagios迁移到Icinga2并有一个问题。 例如,我有一群主机相关的function,例如“networking”。 但是我想用不同的门槛来检查那个组的温度。 例如,对于主机1 60C是正常的,但对于主机2我想设置阈值不超过55C。 什么是组织主机的最佳策略,我应该做出像“web_low_temp”,“web_high_temp”等单独的组合,并绑定单独的检查命令为该组或者也许有人知道更好的解决scheme? ps我相当新与Icinga2请分享您的经验。
我已经在虚拟机上安装了icinga2,用于监视其他5个graphics和icingaweb2作为接口的石墨支持。 最近在我的networking界面,我得到了以下结果: Fatal error: Uncaught exception 'ErrorException' with message 'session_start(): open(/var/lib/php5/sess_3aabfsu76vcdj2hd2u3teofta5dvanpn, O_RDWR) failed: No space left on device (28)' in /usr/share/php/Icinga/Web/Session/PhpSession.php:105 Stack trace: #0 [internal function]: Icinga\Application\ApplicationBootstrap->Icinga\Application\{closure}(2, 'session_start()…', '/usr/share/php/…', 105, Array) #1 /usr/share/php/Icinga/Web/Session/PhpSession.php(105): session_start() #2 /usr/share/php/Icinga/Web/Session/PhpSession.php(215): Icinga\Web\Session\PhpSession->open() #3 /usr/share/php/Icinga/Authentication/Auth.php(344): Icinga\Web\Session\PhpSession->refreshId() #4 /usr/share/php/Icinga/Authentication/Auth.php(166): Icinga\Authentication\Auth->persistCurrentUser() #5 /usr/share/php/Icinga/Authentication/Auth.php(262): Icinga\Authentication\Auth->setAuthenticated(Object(Icinga\User)) #6 /usr/share/php/Icinga/Authentication/Auth.php(93): Icinga\Authentication\Auth->authExternal() #7 /usr/share/php/Icinga/Application/Web. in /usr/share/php/Icinga/Web/Session/PhpSession.php on line […]
在我们公司,我们已经与PNP4Nagios一起安装了Icinga。 我们有一个PNP4Nagios创buildperfdata文件的罕见问题。 每两周,我们注意到我们的icinga服务器停止正常工作,因为它用完inode。 我一直在环顾四周,我注意到问题在这里: 在/ usr /本地/ pnp4nagios的/ var /阀芯 每两周,该文件夹包含超过30万个这种types的perfdata文件: perfdata.1336058870 我认为它必须是一个PNP4Nagios问题,因为我认为通常每个“X”时间,PNP4Nagios应该覆盖现有的perfdata文件,而不是生成新的。 你有什么想法,我可以改变什么或我必须做什么来解决这个问题? 提前致谢。
我有Nagios的工作实例,我想在其他机器上运行Icinga2。 Nagios正在使用NRPE,所以我也想使用它。 我在文件中有以下configuration: object Service "NRPE check load" { import "generic-service" host_name = "agrippina" check_command = "nrpe-check-2arg" vars.host = "agrippina.domain.net" vars.check = "check_load" vars.loads = "'10' '20'" } 和 object CheckCommand "nrpe-check-2arg" { import "plugin-check-command" command = [PluginDir + "/check_nrpe" ] arguments = { "-H" = "$host$" "-c" = "$check$" "-a" = "$loads$" } } […]
我们的备份在第二天的22:00至05:00之间运行。 我无法弄清楚如何在icinga2(在opensuse 42.1上的r2.4.1-1)中使用“apply ScheduledDowntime”在预定的停机时间进行设置。 只是设置22:00-05:00给了我一个错误: 无效的时间范围定义“22:00-05:00”:时间段在开始之前结束 当前的机制使用了一个服务variablesbackup_downtime ,当不为空时,它会触发“apply”规则: apply ScheduledDowntime "backup-downtime" to Service { author = "icingaadmin" comment = "Scheduled downtime for backup" ranges = { monday = service.vars.backup_downtime tuesday = service.vars.backup_downtime wednesday = service.vars.backup_downtime thursday = service.vars.backup_downtime friday = service.vars.backup_downtime saturday = service.vars.backup_downtime sunday = service.vars.backup_downtime } assign where service.vars.backup_downtime != "" } 有人想法? […]
当监视服务器的健康状况时,一些故障或警告立即是紧急的,但是其他故障或警告只在持续时才重要。 我正在考虑这样的事情: 有些软件需要更新 时间偏移量与NTP不同 如果没有得到解决,这些问题可能会成为真正的问题,但已经有后台服务来照顾他们 – 无人看pipe的升级,NTP客户端服务等等。问题产生和这些后台进程之间总是有一个短暂的延迟来解决它们,我们的监视器正在发送一系列电子邮件,然后在一分钟后问题得到解决。 我通常会醒来发现一大堆“问题”电子邮件,每封邮件都有一分钟后发送的相应“解决scheme”电子邮件。 危险的是,在驳斥一百个不相干的警告的时候,我可能会错过那个真实的。 那么有什么方法可以指示Icinga或Nagios只报告一个问题,如果持续超过一定的时间,比如5分钟?
我有一个要求,检查间隔为180分钟,而通知间隔为10分钟。 意味着服务业主希望,如果他错过任何通常在180分钟后发出的警报,如果服务是关键的话,Icinga会不断检查并通知他们,直到服务恢复正常为止。 我尝试了notification.conf中的interval = 0参数,但是这不符合要求。 如果服务不好,它每隔10分钟发送一次警报,但不检查服务。 例如。 如果服务在180分钟之前恢复正常(即下次检查),它将继续提醒直到下一次检查。 在这里发现了类似的问题,但它是Nagios的,我不能将它与Icinga2合并。 我相信这将使用CHANGE_NORMAL_SVC_CHECK_INTERVAL参数完成,但不知道如何实现它。 我也发现下面的Icinga页面: Icinga外部命令链接 请帮助。
我有在VirtualBox的Ubuntu 14.04.3 icinga 2.3.11。 我试图监控“https”端口443例如“ https://mail.google.com ”here.Below是我的代码段从默认的host.conf文件 object Host "mailserver-01" { import "generic-host" address = "74.125.136.17" /* ip for mail.google.com */ vars.os = "Linux" vars.http_vhosts["http"] = { http_uri = "/" } vars.http_ssl = "1" vars.http_warn_time = "5" vars.http_critical_time = "10" vars.notification["mail"] = { groups = [ "icingaadmins" ] } } 以下是默认的services.conf文件的代码片段 apply Service "httpS" { […]
我正在设置Icinga(Nagios fork),我有一些有多个接口的机器。 有些服务只能在其中一个服务器上进行监听并正确检查,我想知道是否可以为Icinga中的单个主机configuration多个IP地址。 这是一个最小的例子: 远程服务器: eth0: 1.2.3.4 (公网IP) eth1: 10.1.2.3 (私有IP,安全隧道) Apache在1.2.3.4:80上1.2.3.4:80 。 (只限公众) OpenSSH在10.1.2.3:22收听。 (仅限内部networking) 在0.0.0.0:25 (所有接口)上侦听的Postfix SMTP Icinga服务器: eth0: 10.2.3.4 (私有IP,Internet访问) 现在,如果我定义一个主机: define host { use generic-host host_name server1 alias server1.gertvandijk.net address 10.1.2.3 } 这不会正确检查HTTP状态。 并定义一个额外的主机: define host { use generic-host host_name server1-public alias server1.gertvandijk.net address 1.2.3.4 } 将检查一切,但显示为两个独立的主机。 现在,我想将这两个主机“聚合”为一个主机,但提供一个简单的configuration来检查服务的正确地址。 什么是最优雅的configuration线保存解决scheme呢? 我阅读了几个可用于解决这个问题的插件,但我无法弄清楚目前的解决方法是什么。 解决scheme回到2003年,但我正在运行Icinga […]
我们使用ks-soft的Advanced Hostmonitor软件包来监视我们networking上的大约2000个项目。 我们觉得这很棒,支持它的人是太棒了,产品是快速,稳定和成熟的,但是我觉得随着公司的成长,我们开始在与后台pipe理系统整合方面出现一些摩擦点。 我们想要做的事情之一就是能够通过API向我们使用的任何监控工具添加新的testing。 例如,当服务器订单来自我们的零售界面时,服务器会自动生成,作为自动化构build过程的一部分,我们希望自动将新的testing添加到networking监控系统。 Hostmonitor通过一个称为HM Script的function对此有一些支持,但是我们开始遇到一些快速启动 – 我们不能添加新的运营商/用户 我们无法定义新的“动作configuration文件” – 这是testing好坏时要采取的行动。 但是我们所喜欢的关于hostmonitor的是行动档案。 例如,如果一个Windows IIS框变坏,我们的一个糟糕的testing的动作configuration文件就像这样: 再次检查主机(一次) 再等待30秒,然后再次testing 尝试重新启动远程计算机上的应用程序池(最多两次) 发送电子邮件给ops关于重启失败 尝试在远程计算机上重新启动IIS(最多四次) 页面值classpipe理员(最多5次 – 值class后pipe理员确认提醒) 页面备份任务pipe理员(5次 – closures后pipe理员确认提醒) 我开始环顾其他networking监控工具,我正在寻找: 一个全面的API能够添加/删除/控制testing/testing“动作configuration文件”/运营商(不只是插件,我们需要控制和pipe理界面) 能够具有相当详细的行动/升级configuration文件(并通过API定义这些) 我看过Nagios和Icinga,但是我不能从他们的文档中收集是否可以使用这些特性,或者如果可以的话,实现/定制将涉及多less工作。 任何人都可以提供任何build议,指导或经验?