中等CPU使用率,但高负载

我知道这已经被多次询问了,即使CPU不是罪魁祸首, wa一般也会导致高负载。 然而,在我们的例子中, wa是〜0,CPU在4核心,8线程专用服务器上是〜45%。 但是平均负载是8.33, 8.47, 8.28

这是一个top的转储:

 top - 11:16:41 up 139 days, 49 min, 1 user, load average: 8.33, 8.47, 8.28 Tasks: 313 total, 5 running, 308 sleeping, 0 stopped, 0 zombie %Cpu(s): 42.4 us, 13.4 sy, 0.0 ni, 36.9 id, 0.0 wa, 0.0 hi, 7.3 si, 0.0 st KiB Mem: 32939280 total, 30515232 used, 2424048 free, 120408 buffers KiB Swap: 1046520 total, 96056 used, 950464 free. 23932456 cached Mem PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND 21382 root 20 0 70288 11360 2028 R 100.0 0.0 22406:05 supervisord 1774 www-data 20 0 286472 30320 8052 S 28.6 0.1 295:05.54 php 309 www-data 20 0 286236 29948 8056 S 28.3 0.1 298:05.63 php 32338 www-data 20 0 286296 30136 8056 S 27.3 0.1 300:02.28 php 913 www-data 20 0 286232 30080 8060 S 26.6 0.1 297:14.66 php 1692 www-data 20 0 286560 30276 8056 S 26.3 0.1 300:22.92 php 32470 www-data 20 0 286608 30324 8052 S 26.3 0.1 296:58.59 php 32029 www-data 20 0 286360 29952 8056 S 25.9 0.1 297:50.51 php 1083 www-data 20 0 286236 30076 8056 S 24.9 0.1 298:42.59 php 32334 www-data 20 0 286604 30368 8052 R 24.6 0.1 300:45.32 php 1214 www-data 20 0 286224 29808 8060 S 24.3 0.1 290:03.53 php 32027 www-data 20 0 286680 30404 8056 S 23.9 0.1 297:58.06 php 1700 www-data 20 0 286508 30096 8060 S 23.6 0.1 286:11.93 php 25453 beansta+ 20 0 1315140 1.242g 616 S 12.0 4.0 342:41.49 beanstalkd 10410 root 20 0 12240 7316 2096 S 3.7 0.0 360:16.80 flash_linux_amd 31498 www-data 20 0 275036 17868 7696 S 2.7 0.1 88:05.09 php 31947 www-data 20 0 274772 17592 7644 S 2.3 0.1 86:49.37 php 1416 www-data 20 0 276064 19404 8096 S 2.0 0.1 0:20.29 php 1427 www-data 20 0 276616 20192 8088 S 2.0 0.1 0:18.78 php 32021 www-data 20 0 275036 17876 7696 S 2.0 0.1 86:26.58 php 32049 www-data 20 0 282144 25776 8088 S 2.0 0.1 0:36.40 php 1433 www-data 20 0 275740 19076 8100 S 1.7 0.1 0:17.99 php 1437 www-data 20 0 275752 19100 8104 S 1.7 0.1 0:17.95 php 14251 www-data 20 0 280348 24008 8112 S 1.7 0.1 3:25.54 php 15057 www-data 20 0 275996 19400 8116 R 1.7 0.1 3:11.02 php 31680 www-data 20 0 282628 26120 8104 S 1.7 0.1 0:36.90 php 31682 www-data 20 0 282920 26436 8100 S 1.7 0.1 0:38.47 php 1431 www-data 20 0 276000 19496 8104 S 1.3 0.1 0:18.67 php 70 root 20 0 0 0 0 S 1.0 0.0 353:48.51 ksoftirqd/6 19845 root 20 0 25620 1752 1116 S 0.7 0.0 59:12.64 top 7 root 20 0 0 0 0 R 0.3 0.0 216:11.85 rcu_sched 15 root 20 0 0 0 0 S 0.3 0.0 66:01.10 rcuos/7 230 root 20 0 0 0 0 S 0.3 0.0 186:54.85 md2_raid1 16833 root 20 0 0 0 0 S 0.3 0.0 0:01.08 kworker/0:1 24417 www-data 20 0 349400 17600 13192 S 0.3 0.1 1:15.44 php5-fpm 30203 root 20 0 0 0 0 S 0.3 0.0 0:00.53 kworker/2:2 1 root 20 0 34172 2752 1228 S 0.0 0.0 3:29.38 init 2 root 20 0 0 0 0 S 0.0 0.0 0:03.85 kthreadd 3 root 20 0 0 0 0 S 0.0 0.0 66:10.86 ksoftirqd/0 5 root 0 -20 0 0 0 S 0.0 0.0 0:00.00 kworker/0:0H 8 root 20 0 0 0 0 S 0.0 0.0 101:00.72 rcuos/0 9 root 20 0 0 0 0 S 0.0 0.0 75:26.50 rcuos/1 10 root 20 0 0 0 0 S 0.0 0.0 66:02.02 rcuos/2 11 root 20 0 0 0 0 S 0.0 0.0 80:03.94 rcuos/3 12 root 20 0 0 0 0 S 0.0 0.0 26:27.47 rcuos/4 

在这台机器上我应该担心什么样的负载平均值(有Nagios唤醒我)?

这取决于负载的性质。 也就是说,它是固定的需求驱动,还是由一个过程产生的,这个过程使用尽可能多的权力(我认为前者是这样的,但我可能在这里是错的)。 OTOH 8对于8个线程来说并不是一个真正的服务器负载,所以如果超过20个,我会担心的。

我想你的平均负荷是可以的。

看看这篇文章,了解负载指标,以及它是如何计算的: http : //blog.scoutapp.com/articles/2009/07/31/understanding-load-averages