监视生产服务器的最佳方式是什么?

我们使用Apache 2和MySQL运行两台生产服务器。 我正在寻找一种可靠的方式来监控我们的负载,稳定性和正常运行时间。

我遇到了monit ,但是有更好的select吗?

我在Slicehost的虚拟机上configuration了Zabbix ,对解决scheme非常满意。 由于它与我们的生产服务器在物理上是分开的,即使生产networking有问题,它也会提醒我。 Slicehost中的虚拟机便宜且易于备份。

Zabbix是伟大的,因为它可以监控网站的响应时间,也是CPU,磁盘,以及其他任何东西。 Zabbix将存储历史数据,以便您可以查看统计数据随时间变化的趋势。 我也比较喜欢Zabbix,因为Zabbix有一个强大的基于web的configuration界面。

我个人使用Munin进行资源和度量报告。 它已经有许多应用程序/指标的插件,并且可以很容易地编写插件。

对于可用性监测/警报,我使用了Zabbix,Zennos,Nagios和Hyperic。 在所有这些,我最喜欢Zabbix。

你可以build立一个免费的监控解决scheme,如Incinga或Nagios 。 每个检查都有很多插件可以想到。 或者你可以编写自己的脚本来报告状态(“好”,“坏”,无论…)。 WhatsUp Gold是一个好的商业机会。 它也包括性能测量工具。

如果你想要一些真正的黄金,看看Jazzey 。 这是一个真正的高端,真正高成本,端到端的监测工具。 它模拟真正的用户使用您的(networking)应用程序。 我们在工作上花费了很多。

Monit在服务器本地工作,所以它不能真正给你实际的稳定性统计。 如果你的服务器上的networking出去了,或者服务器本身出现故障,monit不能通知你。

我使用Zabbix进行负载,稳定性和正常运行时间监控。 它几乎可以做任何你能想到的事情。 唯一的缺点是你需要在外部服务器上运行它。

Nagios是一个很好的起点。 如果您还想跟踪服务器性能的趋势并绘制图表,我build议您也查看一下Cacti。

http://www.cacti.net/