在debian上的单核vps的负载平均值超过20

操作系统：Debian 6.0 RAM：3072 M，CPU：单核。

最佳：

top - 08:56:43 up 21 days, 12:37, 1 user, load average: 28.38, 22.48, 15.95 Tasks: 8 total, 1 running, 7 sleeping, 0 stopped, 0 zombie Cpu(s): 6.3%us, 14.7%sy, 0.0%ni, 17.5%id, 57.0%wa, 0.1%hi, 4.4%si, 0.0%st Mem: 3145728k total, 28144k used, 3117584k free, 10236k buffers Swap: 0k total, 0k used, 0k free, 0k cached PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND 1247 root 20 0 18932 1240 1000 R 0 0.0 0:00.06 top 1 root 20 0 8356 724 676 S 0 0.0 7:41.97 init 3277 root 20 0 208m 11m 5652 S 0 0.4 0:00.17 apache2 3847 root 20 0 22420 1032 788 S 0 0.0 0:12.66 cron 8809 www-data 20 0 208m 7400 1168 S 0 0.2 0:00.00 apache2 26429 root 20 0 70488 3368 2652 S 0 0.1 0:00.80 sshd 26539 root 20 0 19300 2124 1564 S 0 0.1 0:00.16 bash 29551 root 20 0 49168 1152 604 S 0 0.0 0:00.12 sshd

ps aux：

 USER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND root 1 0.0 0.0 8356 724 ? Ss Jul23 7:41 init [2] root 3277 0.0 0.3 213808 11828 ? Ss 08:17 0:00 /usr/sbin/apache2 -k start root 3847 0.0 0.0 22420 1032 ? Ss Jul23 0:12 /usr/sbin/cron root 5870 0.0 0.0 16332 1140 pts/10 R+ 08:58 0:00 ps aux www-data 8809 0.0 0.2 213944 7400 ? S 08:32 0:00 /usr/sbin/apache2 -k start root 26429 0.0 0.1 70488 3368 ? Ss 08:13 0:00 sshd: root@pts/10 root 26539 0.0 0.0 19300 2124 pts/10 Ss 08:13 0:00 -bash root 29551 0.0 0.0 49168 1152 ? Ss Jul23 0:00 /usr/sbin/sshd

我怎样才能找出导致问题的过程？经过一段时间的平均下降，但任何人都可以帮助我find这种行为的原因？

更新：负载平均值233

 top - 10:29:01 up 21 days, 14:09, 2 users, load average: 237.96, 183.80, 98.76 Tasks: 15 total, 1 running, 14 sleeping, 0 stopped, 0 zombie Cpu(s): 9.3%us, 14.2%sy, 0.0%ni, 0.0%id, 72.0%wa, 0.0%hi, 4.6%si, 0.0%st Mem: 3145728k total, 51408k used, 3094320k free, 10272k buffers Swap: 0k total, 0k used, 0k free, 0k cached PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND 1 root 20 0 8356 724 676 S 0 0.0 7:44.70 init 2031 root 20 0 70592 3388 2652 S 0 0.1 0:00.14 sshd 2664 root 20 0 19300 2120 1556 S 0 0.1 0:00.02 bash 3277 root 20 0 210m 11m 5680 S 0 0.4 0:00.57 apache2 3847 root 20 0 22420 1032 788 S 0 0.0 0:12.70 cron 4041 www-data 20 0 211m 7792 1228 S 0 0.2 0:00.00 apache2 13767 root 20 0 32800 1112 812 S 0 0.0 0:00.01 cron 14742 smmsp 20 0 52508 3940 2632 D 0 0.1 0:00.00 sendmail 15769 root 20 0 69232 3092 2408 S 0 0.1 0:00.01 sshd 16154 www-data 20 0 211m 7716 1228 S 0 0.2 0:00.00 apache2 17260 sshd 20 0 50616 1372 728 S 0 0.0 0:00.00 sshd 18436 root 20 0 18932 1248 1004 R 0 0.0 0:00.02 top 26429 root 20 0 70488 3376 2652 S 0 0.1 0:01.11 sshd 26539 root 20 0 19300 2124 1564 S 0 0.1 0:00.29 bash 29551 root 20 0 49168 1152 604 S 0 0.0 0:00.14 sshd

您的服务器在I / O等待中花费了过多的时间。

 57.0%wa

这意味着…磁盘。

这个问题的一个可能的原因是您的VPS运行的服务器与磁盘有问题。这些问题包括但不限于：失败的磁盘; 使用非企业级磁盘; 您的主机尝试在创造性地回收硬件上运行VPS业务等

也可能是因为您正在运行导致exception高的磁盘活动量的进程。不幸的是，信息没有在您的top或ps列表中报告，让我怀疑你有一个低端的基于OpenVZ的VPS。（如果这是真的话，那么就回到上一段。）

至于解决问题，首先要做的是排除任何你的进程，导致大量的磁盘活动。 @Shi提到的iotop程序对此很有帮助。虽然我敢打赌，你什么也找不到。一旦完成，你就联系主机来报告服务器磁盘的一些问题，他们将不得不诊断，因为他们是主机，你不能从容器内看到。

（后来，当你购买一个新的VPS提供商时，请避开任何使用OpenVZ的人，这是我的经验，绝大多数人运行得非常糟糕。）

首先，尝试了解下面的行：

 Cpu(s): 6.3%us, 14.7%sy, 0.0%ni, 17.5%id, 57.0%wa, 0.1%hi, 4.4%si, 0.0%st

你看到用户空间应用程序（％us）的CPU几乎没有任何东西。系统（内核）任务（％sy）很忙，等待（％wa）更多。

等待通常意味着I / O（input/输出）等待。所以，使用iotop检查input/输出统计信息。

由于swap被禁用，swap不会造成这种情况。