服务器监视中等规模的UNIXnetworking

我正在寻找一个好的监视工具或工具的build议来处理混合的Linux(RedHat 4-5)和HPUX环境。

目前我们使用的霍比特人工作得相当好,但是跟踪哪些服务器发出的警报正变得越来越困难。

function我想看看:

  1. 服务器configuration简单
  2. 监视CPU,networking,内存和特定进程的能力

我已经看过Nagios,但是从我所看到的情况来看,对于我们所有的服务器〜200来说,configuration并不是一件容易的事情,而且,如果不在每个代理中安装一个插件,我将无法监控进程。

在您的服务器上设置SNMP,最好通过像Puppet这样的configurationpipe理工具。

然后,使用像Zenoss Core这样的监视工具来监视它们。 Zenoss可以扫描主机的子网,这样可以很容易地添加200台服务器,并且可以以各种方式对服务器进行分组/组织,以确定究竟监视的是什么。

到目前为止,我们只监视了十几个设备,但是Zenossfunction非常强大,而且用户友好。 它有一个友好的graphics用户界面,历史图表,警报等

Nagios可能有一些学习曲线,但是您可以在其configuration文件中定义可以被其他对象重用的模板,以节省您的时间。 这是一个很棒的监控系统。 通常情况下,只要主机运行SNMP,就不需要在每个正在监视的主机上安装客户端。

用它来监视Windows系统可能有点不同。 对于他们而言,NSClient ++工作得很好,即使通过脚本,SMS等也可以轻松安装。http://nsclient.org/nscp/

我的理解是,Nagios更适合于较小的安装。 虽然我没有使用它,但似乎OpenNMS更适合您的安装规模。

有人写了 Nagios和OpenNMS 的比较

好消息是有很多解决scheme来处理你的要求,现在你可以select。 我会研究以下产品:

Zenoss的

基础工作

ZABBIX

Hyperic公司

如果您可以使用SNMP,请查看Cacti 。 添加/删除主机比Nagios更容易,我更喜欢他们的界面。 Cacti能够监控CPU,networking接口,内存使用情况,磁盘空间使用情况和服务。

我build议Zabbix,它可以监视您的主机与SNMP或通过安装在服务器上的代理,它是非常灵活和可扩展的。 Zabbix提供了主机发现,但是你也可以创build一个XML文件来将你的设备导入到它的数据库中。 他们最近发布了一个API接口,可以很容易地将监控数据集成到其他应用程序中(我们已经成功地在这个API的基础上构build了一个Iphone应用程序)。

希望这可以帮助。