“必须拥有”pipe理任意* nix守护进程及其活动的工具

你build议什么工具来pipe理运行的守护进程? 这包括:

  1. 负载监视:当它放慢整个服务器时,守护进程
  2. 保持活力:当它不起作用时重新启动它。 也许,连通性检查?
  3. 任何先进的日志处理/旋转/parsing工具?
  4. 方便的错误通知:电子邮件,icq,jabber,…
  5. 实时监控:munin || nagios,当然! :)也许还有别的不错的东西可以使用?
  6. …其他build议?

负载监视:renice守护进程,当它减慢整个服务器保持活着:重新启动时,它不起作用。 也许,连通性检查?

Nagios可以使用事件处理程序执行这两个任务,但对于renice,我可能更愿意自己运行,因为如果服务器处于加载状态,通过类似ssh的检查可能会超时。 理想情况下,守护进程有自己的控制,以防止这种情况发生,即“最大连接数”。

Any advanced log processing/rotation/parsing tools? 

我喜欢logrotate日志旋转,这是非常标准的。 对于处理,我喜欢Splunk,如果你可以负担得起,或不需要付费版本提供的function。

 Handy error notifications: e-mail, icq, jabber, ... 

要添加到您的列表,许多人喜欢文本(SMS)消息。

看看Cfengine吧。 我们已经将它运行在从Linux到AIX和Windows的所有环境中。 这是开源的,但有一个商业版本,可以做一些额外的技巧,以实现轻量级监控。

Splunk是可以的,但如果你学习一点正则expression式的魔法,那么你不能做的事情也不多。