使用Open Monitoring Distro(OMD)自动监控新的云服务器?

我花了一些时间来使用Nagios,Check_mk和一些其他非常有用的工具,作为OMD包的一部分。

一旦手动安装了check_mk代理,WATO特别适用于通过GUI来pipe理所有静态的基于Windows和Linux的服务器。

我想问问什么是使整个监控stream程自动化的最佳方式? 或者即使可以做到?

我们将使用厨师食谱来定期提供新的服务器,并频繁地closures其他服务器。 如果我们要继续使用Nagios / Check_mk,那么为了追踪和监控我们的基础设施,pipe理员的工作量是非常重要的。

非常感谢您的帮助。 史蒂夫

高级,有两种方法:

  • 让厨师编写有效的Check_MKconfiguration文件(现在已经完成了),并通过WATO自动化触发库存+重新加载。 这可能更透明。
  • 让Check_MK从你的CMDB读取主机(你应该运行一个专业的设置,会有一个…)或从厨师configuration。 这是可行的Check_MKconfiguration允许你基本上任何Python允许你。 所以你可以读取来自LDAP,一些API,厨师configuration,或平面文件的数据。 对我来说,这是更清洁的方法,因为它有一个更直接的“数据”接口。

我想从长远来看,无论如何,第一种方法对你来说会更好,因为它更多地面向WATO。 我仍然会select第二个,并挂钩到EC2虚拟机列表等等。

一个混合是可能的,即一些守护进程监听VM创build事件,并写出configuration到WATO只读文件夹。

注意:如果不对任何这样的数据源进行校验,那将是非常愚蠢的。 仅仅因为一些基础设施代码疯狂增加了一个( 基础设施 )错误,并从主厨中删除了100%的虚拟机,他们不应该立即从监控中删除。

确保它保持有一点带外。

关于dynamicCheck_MK接口的2010-ish文档可以在这里find: https ://geni-orca.renci.org/trac/wiki/OMDeventhandlers

这真的很老,但很好地阐述了基本的想法。

我已经为config-mgmt — Check_MK接口做了第一个概念validation。 没有我想要的那么好,但是受限于我写速度/技能的Python。 🙂

我用它约。 非云70服务器: https : //bitbucket.org/darkfader/nagios/src/461992c2c5452807a37838ca99fd92977fcf96e1/check_mk/ino2cmk/ino2cmk.py?at=default