阿帕奇进程计数尖峰

我们在一个灯箱。 Centos下。

从昨天开始,我们遇到了一个问题。 我们的httpd进程计数在每小时的顶端都会达到最大客户端限制。 首先,maxclient的限制是900,所以它会达到900。

然后我们把它减less到500,现在它达到了500。

因为这发生在一小时的第一分钟。 我们检查了/ var / log / cron日志。 有几个工作接近每小时的开始。 我们把这些cron工作关掉了。 仍然没有改变。 在第一分钟内,一个高峰开始。 并持续约10-15分钟。

就像旁注一样。 我们今天也看到一些被污染的inode。 我们也研究了所有最近的部署。 我们没有任何重大的变化。

以下是服务器开始挂起时的服务器状态输出:

Current Time: Friday, 11-May-2012 21:02:42 UTC Restart Time: Friday, 11-May-2012 19:09:28 UTC Parent Server Generation: 0 Server uptime: 1 hour 53 minutes 13 seconds Total accesses: 1128389 - Total Traffic: 8.9 GB CPU Usage: u203.85 s36.51 cu.1 cs0 - 3.54% CPU load 166 requests/sec - 1.3 MB/second - 8.3 kB/request 500 requests currently being processed, 0 idle workers WWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWKWWWWWWW WWWWWWWWWWWWWWRWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWW WWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWW WWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWKWWWWWWWWWWWWWWWWWWWWWWWWWWWW WWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWCWWWWWWWWWWWWW WWWWWWWWWWWWWWWWWWWCWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWW WWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWW WWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWW Scoreboard Key: "_" Waiting for Connection, "S" Starting up, "R" Reading Request, "W" Sending Reply, "K" Keepalive (read), "D" DNS Lookup, "C" Closing connection, "L" Logging, "G" Gracefully finishing, "I" Idle cleanup of worker, "." Open slot with no current process 

/ var / log / messages连续接收文本如下。 注意有些词是如何腐败的。 我想知道是否有一个系统机制每小时试图解决一些问题:

 May 11 22:46:43 www kernel: <ald(2825): WRITE block urnald(2825): WRITE block 128852880 on sdb1kjournald(2825): WRITE block 12885<7>kjournald(2825): WRITE block 128852896 on sdb1 May 11 22:46:43 www kernel: >kjournald(2825): WRITE block 128853 May 11 22:46:43 www kernel: WRITE block 128853104 on sdb5): WRITE block 128853112 on sdb1 May 11 22:46:43 www kernel: 2825): WRITE block 128853120 on sdb1 May 11 22:47:01 www kernel: ock 685806792 on sda1 May 11 22:47:05 www kernel: ock 129145376 on sdb1 May 11 22:47:10 www kernel: RITE block 789789472 on sda1 May 11 22:47:11 www kernel: ock 129189464 on sdb1 May 11 22:47:16 www kernel: <7ock 129360712 on sock 129360720 on sdb1 May 11 22:47:41 www kernel: <TE block 262819968 on sdb1 

你会在哪里build议我追查引发这个问题的罪魁祸首?

实际访问日志中指向外部用户上升的任何内容? 您可以尝试在事件之前运行apachetop,并在事件发生时观察它。

当有错误的脚本进行recursion请求时,我看到了这样的尖峰。 你可以检查access.log服务器对自己的请求(即search你的服务器的IP地址)?