我正在监视一个应用程序,该应用程序在工作时间之前开始,并在一天结束时使用Nagios 4.3closures。 我已经configuration了通知期,以便在应用程序启动后3分钟启动。 如果Nagios在通知期间开始时发现应用程序状态良好,我希望Nagios发送OK警报。 你会如何build议这样做? 另外,我希望收到一个通知,说明Nagios本身在通知期间开始时仍然活着,所以我知道它正在监视我的应用程序,并能够在出现任何问题时发出警报。 请注意,在工作日开始时,应用程序的“确定”状态将是最近的,因此解决scheme可以利用这一事实(例如,通知前5分钟内的更改)。
我的一个客户build立了一个合stream/ JIRA系统。 他们遇到了一些问题 – 出站电子邮件被楔住,等等。如果你支持JIRA安装,你监视什么? 你使用JMX吗? 直接DB查询? 偶尔的SOAP请求到API? 我将使用Nagios / NRPE进行监控,但是会直接编写任何所需的支持脚本,所以任何运行在Linux机器上的技术都可能是好的。
我有一个奇怪的问题。 我正在尝试安装nagios NRPE,但是它一直在失败 nagios-plugins-1.4.15-2.el5.rf.i386 from rpmforge has depsolving problems –> Missing Dependency: perl(Net::SNMP) is needed by package nagios-plugins-1.4.15-2.el5.rf.i386 (rpmforge) 软件包1:net-snmp-perl-5.3.2.2-9.el5_5.1.i386已经安装并且最新版本。 思考? 环境是安装了Cpanel 11的Centos 5.5。
我们使用nagios监视我们的服务器场,通常它工作得很好。 不过,有时候nagios运行的主机会丢失几分钟的连接,这使得nagios相信它所监视的所有服务器和服务都是closures的。 其结果是数百个警报邮件,紧接着是数百个恢复邮件。 有没有什么办法可以configurationnagios,让它在发布雪崩警报邮件之前testing自己的连接?
我们使用Nagios进行监控。 有没有办法使用SNMP MIB为在其上运行ESXi5.x的R820服务器创build硬件检查? 现在我们正在使用这个python插件: 当前的Python插件 但是由于组织内部的安全政策,我们不能再使用它了。 我们对当前插件的输出感到满意,因此,如果我们可以使用类似的代理程序,使用SNMP进行更less的检查,那将是非常好的。 谢谢
我有nagios警报设置来通过jabber与http链接到ack。 是可能有一个脚本,我可以运行在远程工作站上的terminal,将主机名作为参数,并确认警报? ./ack主机名 这个好处,虽然看起来很平凡,却是三重的。 首先,取消closuresNagios。 其次,nagios的http页面可能需要10-20秒才能加载,所以我想在这里节省时间。 第三,避免使用鼠标+网页界面+ Firefox /其他烦人的浏览器。 理想情况下,我想要一个脚本绑定到一个键盘快捷键,只是最近的警报。 最后,我想从操纵杆,button和其他任何东西上取得input,然后连接到一个绑定到脚本上的大红色button,这样我就可以通过点击button来检查最近的nagios警报。 (如果button的shell上有一个屏幕,显示警报文本越来越大,那么也是一样的) 嘲笑我所有你想要的,但这实际上是对我有用的东西。 如果我每次可以节省五秒钟的时间,而且每天有200次警报,我需要确认一下,这样每天节省15分钟。 系统pipe理员不能自动化可以自动化的东西吗? 谢谢!
我试图设置Nagios来监视我的各种机器使用主机组来定义“机器angular色”,我运行服务来检查angular色的机器。 但是,我想使用条件运算符,使我能够对两个主机组的交集,而不是他们的联合运行服务检查…即使用&&,||或()运算符。 例如,假设我有以下服务器: www-eu : 欧盟的 Linux WWW(Apache)服务器 www-us :Windows WWW(IIS)服务器,在美国(西海岸) ftp-eu :在欧盟的Linux FTP服务器 ftp-us :Windows FTP服务器,在美国 我想创build以下主机组: US-Servers :www-us,ftp-us 欧盟服务器 :www-eu,ftp-eu WWW服务器 :www-us,www-eu FTP服务器 :ftp-us,ftp-eu 现在说我有兴趣检查我的Web服务器的HTTP响应时间。 那么让我们说这个特定的Nagios服务是从美国(西海岸)运行的,而且我有一个名为check_http_response_time的命令。 这个命令将检查HTTP服务器的响应性,我可以提供一个参数来定义提高临界值之前的最大响应时间。 我的命令可能看起来像: check_http_response_time $HOSTNAME$ 50 现在传统上,我可以通过指定主机或主机组列表来运行我的检查。 define service{ use local-service hostgroup_name WWW-Servers # Servers = www-us, www-eu servicegroups WWW Checks service_description Check HTTP Response Time check_command check_http_response_time!50 […]
假设我从同一个操作系统映像构build了1000台服务器,包括SNMPconfiguration在内的一切都是一样的(当然,它们都有唯一的IP地址)。 对于每个服务器,我想通过SNMP使用Nagios来监视相同的12个服务。 在Nagiosconfiguration中,有没有办法configuration每个服务器,以便我不必在每个主机文件中重复12个服务条目? Something like: Host MyHost { ServiceGroup 12Monkeys; } 更好的是,有没有办法说“这1000台服务器,监控这12个服务”? Servicegroup 12Monkeys { Servers: 192.168.0.0/24; } 谢谢!
我们目前已经安装了Nagios 2.9并且已经运行好几年了。 我想把它从旧的Linux服务器迁移到一个新的。 我已经安装了Nagios 3.1.2并运行正常。 在将所有240多台设备迁移到新安装之前,我很好奇其他SysAdmins如何configuration它。 我听说过: – 每个主机都在自己的configuration文件中提供相应的服务,您可以复制然后编辑该文件,轻松添加新设备,并将所有类似设备的文件夹放在不同的文件夹中。 – 一个configuration文件中的所有主机。 有或没有在同一个configuration文件中的所有服务。 – 一个文件中的所有主机和服务。 然后依赖关系放在一个单独的文件(我们当前的configuration) Nagiosconfiguration文件如何在您的系统中传播? 我想得到不同的想法,使我们的最有效率,可以。
我一直负责设置300台服务器的监控,做不同的事情。 我一直在寻找各种工具,比如Nagios,Munin和其他的工具,所以我首先得到了一个很好的主意,就是如何实现监控。 我想知道的是,在我对服务器了解不多的情况下,哪些度量标准通常会被视为一个很好的默认值? 而且,就警报而言,“理智的违约”是什么? 我的计划是部署一个以理智默认值为首的监控scheme,同时绘制出不同系统的angular色 – 我预计这需要一些时间。 这个问题也可以用不同的方式提出: 如果您正在devise一个监控设备,那么它的默认Linux监控模板应该包含哪些内容?