什么是你最有用/有价值的Nagios插件?

我们正在扩大我们的Nagios 3设置,并经常遇到新的NRPE或通用的Nagios插件来testing我们现有的基础设施。 尽pipe如此,这对于Nagios用户最有价值的插件总结是有帮助的。

请在每篇文章中列出一个插件,最好简单介绍一下您为什么喜欢它,以及指向MonitoringExchange或插件开发者网站的链接。 这样,民众可以投票列出已经列出的插件,我们可以按优先顺序看到它们。

出于同样的原因,最好不要列出其他人已经提到的插件。 如果您有更多关于其他人列出的插件的信息,请留下评论。

谢谢!

    在灵活性方面,你不能击败snmp插件。 这几乎是我运行的每一个检查的后面,如果不是,TCP连接是。

    我们最有用的插件是testing我们更高应用程序function的插件。 例如,我们有一些testing,试图login到网站,并试图发送电子邮件,并检查一个POP3邮箱,以确保它到达。 如果这些东西中的任何一个破裂,那么我们可以使用较低级别的检查来查看错误。 pop3死了? MTA,MDA? 数据库服务器? 数据存储?

    老实说,对我来说最check_disk是简单的旧check_disk 。 没有什么让我觉得很特别的,就是“停止吃糊”的方式,就像昨天有一台运行良好的服务器被炸毁,疯狂地跑来跑去,然后发现是因为我让磁盘满了。 在我的生活中从来没有这样做是值得我很多。

    (不要忘记检查inodes,孩子们在家里观看。)

    如果您想要超越check_httpfunction, WebInject对于监控网站非常有用; 它可以处理login页面,并在一个Nagios检查中执行多个步骤。

    我发现check_nfsmount在我的许多服务器上很有用。

    编辑:我也会投票check_snmp如果我有代表这样做。 它在我的所有服务器上都有使用,加上我在所有HP打印机上运行的check_hpjd背后的逻辑。

    我最有用的一个是我自己写的检查我们的networking服务器上的SSL证书,所以我可以留意到期。

    check_nt(与NSClient或类似的主题交谈)可以让你在Windows机器上询问WMI – 如果有一个性能计数器,你现在可以用Nagios监视它。

    PNP(pnp4nagios.org) – 为输出perf的任何Nagios检查生成RRD风格的图。 数据。 非常有用的,特别是当试图说服开发者,新安装的服务真的是所有这些CPU高峰的原因…

    这是一个无耻的插件,但如果你使用NRPE监视Windows机器, NagiosPluginsNT似乎工作得很好。 😉

    我会同意check_snmp是一个非常有价值的插件; 它几乎可以用于任何目的,一切都显示在SNMP中。 SNMP可用于HP-UX,Tru64和OpenVMS等多种系统,无需额外安装。

    另一个(不是很完美的)插件是非常有用的NagiosGrapher; 我有我的经验,在一篇文章中解释更多,但也让其他人可以使用它没有任何困难,我经历了。

    最后一个:NSCA。 你可以编写一个Perl或Ruby或ksh脚本,并将输出提供给NSCA。

    在NSCA和SNMP的灵活性与NagiosGrapher的报告结合之间,这应该扩大你的监控。

    我喜欢check_http来检查我的网站是否还在工作,我已经扩展了它来检查在我的托pipe公司决定提供空白页面一次后,我发现某些文本,我的nagios检查所有通过服务器仍在运行。

    对我来说最有用的是我为我的需求写的: nagios-check-webpage

    它使用js / css / images下载整个页面,使用multithreading和gzip(节省很多带宽),就像真正的导航器一样。

    第一个是NagiosWSC它可以让你通过WMI对Windows主机进行无代理监视

    一个检查实际的延迟拉起网站,并扫描一个“状态:好”隐藏标签。 它遇到了一个问题,我们的鱿鱼caching和一个语言设置的问题,只发生在凌晨3点,每当有人点击该网站的浏览器,要求土耳其语语言国际化版本的网页,每几个晚上一次。

    严重的是,build立你可能能够进行的每种types的监控。 您可以在具有良好监控的复杂环境中捕捉的奇怪错误和错误令人惊叹。 另外,将您的性能数据logging到rrd数据库并将其显示在Cacti中。

    最重要的插件之一是我自己写的:check_rdiff_backup。 我在海外做备份,Nagios告诉我他们是否和什么时候发生了什么事情。

    如果您正在寻找rdiff-backup插件,那么您可以在Google上find它。

    check_curl对我来说是天赐之物。 真的做网站检查的灵活性的差异,也发现它比webinject容易得多,几乎所有相同的function,我需要

    不是严格意义上的插件,而是使用twurl( https://github.com/marcel/twurl )作为启动警报的工具,这绝对是天赐之物。 不需要短信提醒,只需要全面满足。

    有关如何完成的详细信息: 使用twitter(与twurl)不发射的Nagios警报 – 无耻的自我推销的道歉;)

    其他事情…

    Check_diskio( https://trac.id.ethz.ch/projects/nagios_plugins/wiki/check_diskio )与标准的CPU负载和进程号检查结合起来,在确定何时/如何绑定IO以及以何种方式。 使用nagiosgraph( http://exchange.nagios.org/directory/Addons/Graphing-and-Trending/nagiosgraph/details )使它更容易。

    那么简单的,简单的和默认的 – check_disk,check_load,check_http对于大多数情况来说都是完美的(大多数情况下我们想知道服务器,网站是否正常运行,是否正确)

    而不是check_disk和check_swap,有一个check_memory http://exchange.nagios.org/directory/Plugins/Uncategorized/Operating-Systems/Linux/check_memory/details它给内存usuage

    Centreon定义图表和所有的Nagiosfunction!

    与check_nrpe 链接文本一起使用的check_multiprocs

    这是一种欺骗,因为我已经做了很多的开发,它实际上一次检查了很多不同的东西,但对我来说,最有用的nagios“插件”是Resmon 。 它是您在服务器上运行的代理,而nagios通过http连接来执行检查。 我想这跟nrpe做的很相似,但是有很多不同的devise决定。

    我曾经使用过两个插件,一个是提供警报的XML提要,另一个是通过twitter发送警报。 两者都是有用的(除了普通的插件)。 如果你把NRPE算作一个插件,那么也加上。

    check_apt真的很酷,并提醒我更新我的Debian服务器。

    最近,我开始使用check_multi插件,使用修补/ 增强的NRPE来实现较大的输出(由于HTML和性能信息)。
    这几乎是“统治所有人的一个插件”! 😉