Articles of Nagios

使用Nagios检查服务不可用是否合理?

假设我有一个私人界面和一个公共界面的服务器。 公共可能有像HTTP(S)服务器,私人可能有MySQL和SSH的东西。 显然,Nagios对于检查服务是否在各自的接口上运行很有用。 但是,build立明确testingMySQL和SSH端口未在公共接口上打开的检查是否是一个好主意? 这个想法是捕捉无意中的错误configuration,这些错误configuration已经打开了应该是私密的服务,并适当地提醒。 我的一部分想法是,这不会很好地扩展 – 想象一下iptables的DROP规则,例如,检查将不得不等待超过检查超时,然后才能完成并继续。 但是,这种超时时间必须足够高才能区分被封锁的服务和真正陷入困境的开放服务。 这是一个实际的想法? Nagios是正确的工具吗? 我甚至没有考虑否定TCP检查插件的结果的可行性,但我相信这是可行的…

如何使用Nagios监视Windows主机?

我如何使用Nagios来监视Windows客户端? 有没有其他解决scheme?

Nagios服务器最佳实践?

我运行一个中型的Nagios服务器。 它目前监视着大约40个有180个服务的服务器,并且只在一天中增长。 我从一个古老的Nagios设置中迁移出来,这个设置以非常深奥的方式进行configuration,迫使我从零开始重新configuration所有的东西。 现在,服务器正在运行,并为我们所需要的大部分工作,我正在考虑使其更具可扩展性; 当前每台主机都是/ etc / nagios / hosts /中的自己的文件,并且每台主机都在同一个文件中包含所有的服务。 这显然不是最优的,但是也不是将我的所有configuration混淆成数百个不同的文件。 所以我的问题是这个。 对任何经验丰富的Nagiospipe理员来说,使用主机组/服务组的最佳方式是什么, 而不会使configuration过于复杂?

聪明的nagios警报方法

我们使用Nagios,当有事情发生时我会收到短信。 许多其他系统pipe理员也获得文本。 然而,有没有其他聪明的/酷的其他方式人们已经得到了nagios警报?

Nagiosgraphics解决schemevs Munin / Cacti / Ganglia

我有一个监控〜30个Windows服务器的nagios服务器设置。 我想添加一些趋势图表。 我读过nagiosgraphics插件很简单 ,许多人使用独立的,独立的图表/趋势工具。 nagiosgraphics插件与独立产品(如ganglia / munin / cacti)有什么限制? 我对独立软件包提供的特定function和优势感兴趣,而nagios绘图插件则没有。

Nagios监测网站上的文本

我想知道是否可以通过监控网站上的文字获得帮助。 IE浏览器如果我想监视google.com文本“隐私”,我想我会使用下面的命令: check_http -H google.com -u http://www.google.com -s "Privacy" 但它不工作。 无论我在报价中input什么,我都会“确定”。 我显然使用错误的命令或错误的选项。 请帮忙。

为什么getfattr不显示任何扩展属性位设置的文件?

我已经在CentOS 6.2上运行了Nagios XI安装,并且想要修改备份脚本。 我注意到扩展属性位是为这个shell脚本设置的,所以我想确保当我修改它时不会弄乱任何东西。 我进行了实验,发现“cp -p”不保留这个设置(请参阅此处更新的评论)。 我是Linux新增的扩展属性,发现有一个命令“getfattr”应该显示扩展属性,但是它不显示任何文件。 cd /usr/local/nagiosxi/scripts ll backup_xi.sh -rwxr-x—. 1 nagios nagios 2757 Jul 3 10:03 backup_xi.sh* # nothing is displayed by 'getfattr': getfattr -d backup_xi.sh # and nothing special seems to be present according to 'getfacl': getfacl backup_xi.sh # file: backup_xi.sh # owner: nagios # group: nagios user::rwx group::rx other::— 最终,我的目标是修改文件,同时保留原始产品安装过程中设置的任何属性。 […]

我如何取消Nagios的计划停机时间?

我有一个Nagios 3.5.1监视一堆服务器。 在做一个像Drupal或Wordpress核心升级的行动,我下了网站,并将Nagios设置为计划停机。 有时我在2小时的默认情况下完成,不想忽略中断。 我如何告诉Nagios我已经完成并取消预定的停机时间?

如何检查什么时候yum更新是上次运行的

有没有一个规范的方法来找出最后一次在系统上运行yum update ? 我们的设置是,我们有运行自动更新的服务器,并提供他们不会倒戈,我们将手动更新我们的生产服务器约一个月(禁止关键更新)。 (我说手动,理想情况下,我想手动触发所有的更新,但这是另一个问题)。 但是,你忙,任务滑等。所以我想build立一个纳吉奥斯检查,如果我们已经离开太久,将开始打扰我们。 searchnetworking并没有让我走得很远。 在系统周围,我迄今为止发现的最好的东西就是这样的: grep Updated /var/log/yum.log | tail -1 | cut -d' ' -f 1-2 这给了我像Mar 12 ,然后我可以转换成date。 date是今年还是去年会有一些小小的复杂情况,我也需要检查/var/log/yum.log.1 ,以便在logrotate之后立即检查。 但是这只是脚本细节。 这当然可以通过更新到单个软件包而不是通用更新来“欺骗”。 那么有没有一个更经典的方式来看看什么时候yum update运行? 编辑:我现在写了一个Nagios NRPE插件,使用我在问题中提出的想法。 你可以从https://github.com/aptivate/check_yum_last_update抓取它

什么警告和关键值用于check_load?

现在我正在使用这些值: # y = c * p / 100 # y: nagios value # c: number of cores # p: wanted load procent # 4 cores # time 5 minutes 10 minutes 15 minutes # warning: 90% 70% 50% # critical: 100% 80% 60% command[check_load]=/usr/local/nagios/libexec/check_load -w 3.6,2.8,2.0 -c 4.0,3.2,2.4 但是这些价值只是随机挑选出来的。 有没有人有一些testing值?