目前,我们的一台服务器目前的平均负载量已经达到了数十亿(ab),同时报告说它只有1,031个驻留线程:
top - 12:04:26 up 2 days, 19:03, 68 users, load average: 381713318.29, 2612390757.45, 2824329668.69 Threads: 1031 total, 10 running, 1019 sleeping, 2 stopped, 0 zombie %Cpu(s): 34.0 us, 6.8 sy, 0.0 ni, 38.5 id, 20.6 wa, 0.0 hi, 0.0 si, 0.0 st KiB Mem : 49284928 total, 3913012 free, 3702836 used, 41669080 buff/cache KiB Swap: 12582908 total, 12575140 free, 7768 used. 43752932 avail Mem
除了高得离谱的负载平均值之外,这台机器似乎完全正常工作。 它是响应式的,系统日志中没有任何exception,等等。这是运行内核3.10.0-327.36.3.el7.x86_64的CentOS 7机器。
以前有没有人看过类似的东西,或者有谁能解释一下,如果一台机器的平均负载比线程数更高,那么这个解释是什么意思呢?
我最好的猜测是光泽代码中的一个错误是人为地夸大了平均负载。
您是否在服务器上进行监控,以便您可以观察负载平均值随时间变化的情况? 它单调增加吗? 几何? 还是在启动/文件系统挂载/用户login时立即增加到一个庞大的数字,并留在那里?