我运行一个相当繁忙(70万页的浏览量/日,PHP / MySQL)网站,获得稳定的stream量(通常没有尖峰)。 在过去的两天,在高峰使用时间附近,大约一个小时,我的网站突然从非常快到没有反应,大约一个小时,然后回到超快。
凌晨2点10分,CPU负载剧增:
12:00:01 AM runq-sz plist-sz ldavg-1 ldavg-5 ldavg-15 12:10:01 AM 1 270 2.54 3.56 4.00 12:20:01 AM 10 270 5.58 5.09 4.61 12:30:01 AM 9 297 10.06 9.63 7.22 12:40:01 AM 7 296 3.42 5.17 6.15 12:50:02 AM 8 291 4.36 4.57 5.43 01:00:02 AM 20 297 9.38 7.57 6.49 01:10:01 AM 6 279 5.83 6.86 6.90 01:20:01 AM 11 263 5.77 5.43 5.98 01:30:01 AM 2 291 6.70 5.56 5.66 01:40:01 AM 2 285 3.73 5.09 5.37 01:50:01 AM 6 285 3.84 4.65 5.11 02:00:01 AM 8 283 2.56 3.72 4.45 02:10:01 AM 2 431 14.67 10.88 7.34 02:20:01 AM 1 425 7.10 11.48 9.73 02:30:01 AM 4 453 10.30 12.79 11.23 02:40:01 AM 2 440 14.12 16.13 13.41
这是我的数据:
HostGator VPS 7级,2 x 2GHz CPU,3.2G RAM,CentOS 5.9,Apache 2.2.19,MySQL
我真的不知道从哪里开始调查这个问题。 我会很感激任何指针:
1 – 如何完全诊断这个问题现在2 – 或者安装什么工具/命令运行捕获额外的数据,当它再次发生。
提前致谢。
如何诊断: – 绘制图表。 使用munin,仙人掌或其他外部监测系统了解,究竟是什么样的资源已经结束。 – 使用atop或sar获取有关时间线中的stream程活动的详细信息。 当你的服务器停机,检查转储后退。
问题原来是一个行为exception的cpanel系统cron作业,用尽了所有的CPU,反过来导致apache无法提供请求。