我们有3个专用服务器,使用openVZ分割成几个VPS。 我们使用munin来监控生产站点的VPS,并监控某个VPS,以确保在发生故障时重新启动服务。
事情是,我们需要一个更好的方式来监视我们的所有服务器,因为我们有多达14个VPS,我们希望有一个中心中心,我们不仅可以看到由慕尼黑收集的数据,而且还有一些额外的统计数据在我们的服务的networking和performance。
我们的一些要求:
– 短信通知失败(能够设置特定的自定义validation)
– 日志分析器的Apache的error_log和其他一些。
– 必须是中央(意味着一个服务器和几个节点收集数据)。
– 不需要易于安装,但易于维护。
– 需要自由
我已经指出了尼吉欧斯和stream氓,你怎么看? 谢谢,
我有一个类似的设置,除了Xen的地方。 我一直很满意的组合:
我希望分享我们的监测设置将帮助你:-)
这里有一些有用的链接:
http://www.ibm.com/developerworks/linux/library/l-ganglia-nagios-1/index.html
https://www.ibm.com/developerworks/linux/library/l-ganglia-nagios-2/
http://www.ossec.net/main/splunk-ossec-integration
更新:
我忘了提及我们也使用了Matt Simmons Nagiosconfiguration布局,在这里findhttp://www.standalone-sysadmin.com/blog/2009/07/nagios-config/
这种布局使得我们的Nagiosconfiguration更加清晰,维护也更容易(谢谢Matt!)
我在Zabbix上取得了巨大的成功,它可以满足您所有的要求。

最难的部分是获得apache日志监控,但Zabbix是可扩展的,所以你可以使用LogWatch或其他一些Perl脚本来为你获取数据。
我喜欢OpManager,而且它的空闲达到了一定数量的节点。 以上所有内容都很容易安装和维护。
Nagios应该是一个不错的select。 首先 – 它是模块化的,满足您所有的期望。 此外,它还获得了一些不错的奖项 。
编辑:不要忘记检查这个答案 。