可能重复:
你用什么工具来监视你的服务器?
你用什么应用程序来监视你的服务器,他们监视什么?
我对last.fm的一些显示器印象深刻

我们使用nagios监视和警报和Munin系统graphics。
Nagios虽然不完美,但确实是一个痛苦的configuration,大部分是我们需要的。
Munin是我见过的最简单的graphics系统。 这是rrdtool的又一个包装,但没有任何的痛苦。 需要5分钟才能启动并运行。 添加新graphics也是非常微不足道的。
我们使用IPSWITCH WhatsUpGold – 它对我们来说工作得非常好,而且易于使用。
我使用以下组合:
Nagios,包括通过NRPE for Linux / NSCP for Windows的远程检查; Ganglia收集系统级统计信息
整体端到端服务的外部testing是通过Pingdom进行的。
我们监视一些基本的系统东西 – CPU负载,可用空间,内存。 我们还开发了一些模板式的检查,使我们可以轻松地添加一个新的服务器,它将inheritance所有现有的监测检查,只是基于它的组成员资格。
最初的部署是有点多变的,但是现在非常stream畅,而且由于它是集中式的,并且可以“聚集”(在一定程度上),所以我们计划replace我们所有的本地“monit”安装。
对于快速设置和有限的服务器(我有40),Munin是一个不错的select。
你应该编写脚本来监视比传统的服务(CPU,内存,networking,磁盘等)?
System Center Operations Manager :Windows系统和服务的运行状况监视。 也有一些新的跨平台function。 还使用第三方解决scheme进行安全健康监控。
另一个不错的select是Servers Alive。 我已经在许多不同的环境中使用它,取得了很大的成功。 它很容易设置和灵活。
这取决于你需要什么。 对于上述我们使用我们自己的产品( pipe理员阿森纳 )。
如果您正在寻找应用程序监视(Active Directory,Exchange,MS-SQL),那么Quest Software是一个不错的select。
如果您需要监控您的公司网站,您可以尝试HP SiteScope (以前称为Mercury SiteScope)。 还有一大堆托pipe的网站监控解决scheme。
这也取决于你什么时候有警报发生。 你需要采取纠正措施吗? 你想如何提醒? 大多数应用程序支持电子邮件,但您是否需要将警报发送到托pipe对象等控制台,或使用帮助台软件打开帮助台票证? 如果你需要一些这些东西,那么你可能在IBM Tivoli或微软系统中心等大型枪支项目的市场中。 他们会花费你一分钱,但他们是非常强大和可定制的。
我们广泛使用Intermapper 。 我们的电信集团得到了它,但它很快扩展到一个统一的服务器/networking监控工具。 我们甚至为它编写了一些定制的探针。