我们在亚马逊(ec2)的c1.xlargetypes上有几台计算机,运行Amazon AMI。
机器上的细节:
7 GB的内存
20个EC2计算单元(8个虚拟核心,每个2.5个EC2计算单元)
1690 GB的实例存储
64位平台
I / O性能:高
API名称:c1.xlarge
几台机器中的一台显示出高的平均负载,因为我们已经跑了几个星期的最后一次升级。 我们还没有更新其他机器,一切都看起来很正常。
奇怪的是,顶部的命令没有显示任何提示的负载的原因。 CPU是4.8%us , 1.1%sy , 0.0%ni , 94.1%id , 0.0%wa , 0.0%hi , 0.0%si , 0.0%st (见下文)。 Mem约1.5GB免费。
任何想法是什么,或者我们可以检查? 非常感谢您的帮助。
# # top # top - 07:57:42 up 4:18, 1 user, load average: 1.36, 1.45, 1.47 Tasks: 131 total, 1 running, 130 sleeping, 0 stopped, 0 zombie Cpu(s): 4.8%us, 1.1%sy, 0.0%ni, 94.1%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st Mem: 7120092k total, 5644920k used, 1475172k free, 532888k buffers Swap: 0k total, 0k used, 0k free, 3463936k cached PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND 1557 mysql 20 0 1829m 374m 6448 S 14.3 5.4 11:15.09 mysqld 6655 apache 20 0 416m 49m 3744 S 9.3 0.7 0:04.85 httpd 27683 apache 20 0 421m 54m 3708 S 9.0 0.8 0:00.99 httpd 6682 apache 20 0 424m 57m 3788 S 8.3 0.8 0:03.81 httpd 16816 apache 20 0 419m 51m 3760 S 4.3 0.7 0:04.09 httpd 22182 apache 20 0 417m 50m 3756 S 1.7 0.7 0:06.34 httpd 219 root 20 0 0 0 0 S 0.3 0.0 0:00.34 kworker/7:1 699 root 20 0 0 0 0 S 0.3 0.0 0:00.40 kworker/3:1 1 root 20 0 19376 1508 1212 S 0.0 0.0 0:00.29 init 2 root 20 0 0 0 0 S 0.0 0.0 0:00.00 kthreadd
“iostat”命令在适当的机器上:
avg-cpu: %user %nice %system %iowait %steal %idle 8.97 0.03 4.46 0.19 0.14 86.23 Device: tps Blk_read/s Blk_wrtn/s Blk_read Blk_wrtn xvdap1 1.60 0.69 55.38 587620 47254184 xvdfp2 2.64 1.10 61.04 934786 52091056 xvdfp4 0.86 0.19 41.72 163866 35601920 xvdfp1 4.37 36.59 73.89 31220810 63051504 xvdfp3 8.03 7.08 94.63 6045402 80749184
有问题的机器上的“iostat”命令:
avg-cpu: %user %nice %system %iowait %steal %idle 9.29 0.04 5.55 0.26 0.11 84.74 Device: tps Blk_read/s Blk_wrtn/s Blk_read Blk_wrtn xvdap1 2.13 3.34 68.85 246244 5077888 xvdfp1 7.60 74.31 104.88 5480362 7734840 xvdfp3 13.22 73.67 125.00 5433386 9218600 xvdfp4 1.11 0.76 65.08 55762 4799248 xvdfp2 4.16 3.31 99.17 243818 7313264
有谁知道我需要做什么?
谢谢
有8个虚拟内核,1.4的平均负载不高或者担心什么(在平均负载为8的情况下,您可以安全使用)。 但是单凭这个最高产出,就没有足够的信息来帮助你。 而且由于机器只有4个小时的时间,MySQL仍然可能正在启动所有的caching。
它可能是I / O和亚马逊没有提供相当正确的信息为iowait准备绘制(相当典型的一个VPS)。
iostat并发布结果。 Munin一起绘制graphics,并返回一些统计数据。 高负载平均值可能由I / O问题引起。
尝试运行iostat -x 10 10
并观察随着时间的推移等待和%util数。
等待 – 每个IO请求完成的平均时间。 这包括请求在队列中等待的时间以及请求由设备提供服务的时间
%util:这个数字描述了设备用于服务请求的时间百分比。