Ubuntu负载平均峰值,但CPU闲置
我们有一个由第三方提供的云networking上的服务器。 我们正在运行Ubuntu 10.04服务器版。 问题发生在看似随机的时间,每天大约有一到三次。 上面的平均负载通常在2左右,服务器运行的很好,但是在这些随机的时间里,平均负载达到30-35,一切都停下来了。 无法访问我们的网站,无法在服务器上执行命令,无能为力。 如果您尚未login,甚至无法login。 我们能够看到高负荷平均值的唯一方法就是不断跑高点,以便在问题发生时已经运行。 似乎如果它已经在运行,它将继续正常工作,但是如果它没有运行,你将无法启动它。 进入这种状态时无法运行任何命令,这使我们很难诊断问题……再加上我们不认为自己是服务器专家。 对我来说奇怪的是,负载平均峰值如此之高,但处理器保持闲置,并有大量的可用内存。 再一次,我不是一个专家,但是我最基本的理解是,如果内存是可用的,处理器没有被刷新,那么不应该有进程在等待(很可能我错了)。 当我input这些内容时,我发现它已经开始飙升,并且在所有事情都被locking之前设法执行了一些命令。 输出如下: uname -a Linux <server name> 2.6.32-308-ec2 #16-Ubuntu SMP Thu Sep 16 14:28:38 UTC 2010 i686 GNU/Linux 最佳 top – 10:55:08 up 15:28, 4 users, load average: 12.29, 7.01, 3.89 Tasks: 313 total, 3 running, 308 sleeping, 0 stopped, 2 zombie Cpu(s): […]