我们使用Nagios插件check_total_procs来检查我们服务器上的进程总数。 这个安装的默认设置是:
command[check_total_procs]=/usr/lib/nagios/plugins/check_procs -w 150 -c 200
使用这些设置,几乎所有的服务器都处于警告状态(超过150个进程)或临界状态(超过200个进程)。 这些服务器都是基于Debian的,主要是Web和数据库服务器。
我的问题是这些默认值是一个很好的基准? 我应该担心,我的大部分服务器似乎有超过200个正在运行的进程,或者运行标准LAMP堆栈的机器是非常正常的吗?
每个服务器都是不同的 – 尤其是web服务器往往有很多进程,特别是如果他们很忙的话。
您可以做的最好的事情是在正常运行一周的时间内监视您的服务器,并查看您的服务器有多less个进程是正常的,然后适当地configurationNagios。
不要像这样默认,没有典型的服务器这样的事情!