每秒2000个系统中断:值得关注?

操作系统:CentOS 5.5 64位
软件:Postgresql
硬件:Sun X4200; 双核AMD Opteron 1Ghz(x4); 8GB内存; LSILogic RAID控制器+ 2x146GB 10K驱动器。

运行net-snmp并使用Traverse进行监视。

看到每秒不断的2000+系统中断。 遍历标志这是“关键”(默认configuration)….这个数字是真正值得关注的东西吗?

看中断的高数字结果:

[~]# cat /proc/interrupts CPU0 CPU1 CPU2 CPU3 14: 136 54655160 2332995 722234 IO-APIC-edge ide0 66: 618 329180300 20802132 172490 IO-APIC-level ohci_hcd:usb2 74: 4949 16107320 2295957 846017 IO-APIC-level ioc0 82: 22 662837259 233 129090405 IO-APIC-level eth0 90: 723 505860358 0 18967685 IO-APIC-level eth2 NMI: 187529 250006 100435 166795 LOC: 2140313519 2140313343 2140313287 2140313203 ERR: 0 MIS: 0 

关于上述输出的另外一个问题:即使没有连接USB设备,并且IDE设备(CDROM)未使用,为什么ide0和usb2显示的是中断的持续累积? 这个问题是为了我自己的好奇心。

以1000Hz运行的LOC中断对于那些内核是正常的 – 在该内核版本中没有dynamic的刻度支持,因此定时器中断不断运行。 如果系统上的networking和磁盘负载很高,其他的中断也可能是正常的。

最可疑的是ohci_hcd:usb2中断 – 也许一些USB设备是(或是)行为不端(或者只是大量使用,那么这是正常的)。

我也看到他们,所以我不认为:

http://www.teaparty.net/munin/net/teaparty.net-irqstats.html

(去年六月硬件被完全取代,因此突然上涨)

这个服务器故障文章和它引用的这个异地文章也是发人深省的。