Ubuntu 10.10 Maverick Server使系统locking随机间隔(i7 930; 12GB RAM)

介绍:我有一台机器,具有以下规格:

  • 英特尔酷睿i7 930
  • 12GB Ram海盗船
  • 2xSamsung硬盘320GB(没有RAID,只是分区)
  • 华硕P6TD Deluxe

机器已经在Datacenter几天了。 平均负载是0.50,我有以下分区:

  / ext4 noatime,barrier = 0,errors = remount-ro 0 1
  / datos ext4 noatime 0 2 

现在的问题是:随机间隔,机器locking,SSH严重滞后,并观看htop,它说,所有的核心正在受到系统进程的打击。 http://korrupzion.com/htop.png

冻结期间Iostat输出(当我终于设法执行一个冻结命令时得到这个):

  iostat的
 Linux 2.6.35-22-server(charizard)25/10/10 _x86_64_(8 CPU)

 avg-cpu:%user%nice%system%iowait%steal%idle
            4,33 0,00 10,38 1,21 0,00 84,07

设备:tps Blk_read / s Blk_wrtn / s Blk_read Blk_wrtn
 sda 2,68 269,23 0,01 906918 24
 sdb 52,30 897,99 1896,08 3024878 6386976

Vmstat输出:

 vmstat 1
 procs -----------内存---------- --- swap-- ----- io -----system-- ---- cpu-- - 
  rb swpd免费的buffcachingsi所以在我们sy sy洼
  0 1 0 5680460 128056 1907340 0 0 115 131 1091 2621 4 9 86 1
  4 0 0 5676360 128064 1909036 0 0 1872 52 4606 18143 10 33 57 0

我怀疑ext4与那些冻结有关,但我不知道。 Ubuntu在一周前被安装,然后将机器发送到数据中心,在此之前,我有Windows 7testing性能,并没有任何forms的冻结

请如果你知道另一个命令来跟踪这个冻结的源头让我知道,我想再次格式化到debian lenny,这是我用来安装到其他机器没有问题

谢谢。

编辑1:我重新安装了“/ datos”,屏障= 0,现在我正在监视是否再次出现问题。

编辑2:重新安装/数据与barrier = 0没有工作uu仍然试图find解决scheme

我刚刚在五天前向Launchpad报告了一个同样的问题。 它也是英特尔酷睿i7-930,在英特尔DX58SO主板:

https://bugs.launchpad.net/ubuntu/+source/linux/+bug/665796

当然,你的问题是一样的,你的描述与我的问题相符。 检查系统定时器中断是否在这些locking期间冻结。 保持在terminal运行:

watch -d grep timer /proc/interrupts 

在locking过程中,您将需要一个外部中断源,以使进程调度程序运行并查看执行的命令。 从另一台计算机Ping(小时间间隔)将有助于您的计算机。

如果在locking期间定时器中断停止递增,那么这也是同样的问题。 请将您的系统信息添加到上述错误报告中,以便我们从Ubuntu开发者那里获得关注:

 ubuntu-bug -u 665796 -p linux 

除了cpus的锤击,我会猜到这是DNS相关的。

我会猜测DNS的原因是

  1. 该机器已被移入新的数据中心
  2. 随机冻结通常来自于尝试连接和超时的事情

你检查resolv.conf并确认dns服务器是可达?

10.10也经历过同样的问题,也是一个Core-i7 930,但只有一个6 GB的RAM。 在研究中,这可能是Xorg中的回归问题 – 您是否在使用任何types的GUI桌面环境? 如果是这样,这个错误报告可能与你有关: https : //bugs.launchpad.net/ubuntu/+source/xorg/+bug/658649