监控生产服务器

我们有3个专用服务器,使用openVZ分割成几个VPS。 我们使用munin来监控生产站点的VPS,并监控某个VPS,以确保在发生故障时重新启动服务。

事情是,我们需要一个更好的方式来监视我们的所有服务器,因为我们有多达14个VPS,我们希望有一个中心中心,我们不仅可以看到由慕尼黑收集的数据,而且还有一些额外的统计数据在我们的服务的networking和performance。

我们的一些要求:
– 短信通知失败(能够设置特定的自定义validation)
– 日志分析器的Apache的error_log和其他一些。
– 必须是中央(意味着一个服务器和几个节点收集数据)。
– 不需要易于安装,但易于维护。
– 需要自由

我已经指出了尼吉欧斯和stream氓,你怎么看? 谢谢,

我有一个类似的设置,除了Xen的地方。 我一直很满意的组合:

  • 用于提醒的Nagios (使用PNP进行一些精简graphics,Nagviz用于服务状态仪表板)
  • Ganglia为系统的历史图表
  • OSSEC作为HIDS,同样也是集中采伐的收集者
    • sidenote:OSSEC有一个Splunk插件,它很好地整合了这两个工具,但我仍然在等待它们将它移植到Splunk v4上。
  • Splunk最后,一旦一些Splunk插件被迁移,我们计划使用Splunk进行一些预过滤日志(不要超过免费版本的上限)

我希望分享我们的监测设置将帮助你:-)

这里有一些有用的链接:

http://www.ibm.com/developerworks/linux/library/l-ganglia-nagios-1/index.html

https://www.ibm.com/developerworks/linux/library/l-ganglia-nagios-2/

http://www.ossec.net/main/splunk-ossec-integration

更新:

我忘了提及我们也使用了Matt Simmons Nagiosconfiguration布局,在这里findhttp://www.standalone-sysadmin.com/blog/2009/07/nagios-config/

这种布局使得我们的Nagiosconfiguration更加清晰,维护也更容易(谢谢Matt!)

我在Zabbix上取得了巨大的成功,它可以满足您所有的要求。

替代文字

最难的部分是获得apache日志监控,但Zabbix是可扩展的,所以你可以使用LogWatch或其他一些Perl脚本来为你获取数据。

我喜欢OpManager,而且它的空闲达到了一定数量的节点。 以上所有内容都很容易安装和维护。

Nagios应该是一个不错的select。 首先 – 它是模块化的,满足您所有的期望。 此外,它还获得了一些不错的奖项 。

编辑:不要忘记检查这个答案 。