有一个简单的方法来确定是否中断是一个性能问题? 我有以下从猫/ proc /中断,但真的没有这台服务器的历史,所以我不知道这是否可能导致任何问题。 我在http://www.centos.org/docs/5/html/5.1/Deployment_Guide/s2-proc-interrupts.htmlfind了每一列的定义,但是似乎没有find任何关于结果可以接受。
CPU0 CPU1 CPU2 CPU3 CPU4 CPU5 CPU6 CPU7 0: 1408788887 0 0 0 0 0 0 0 IO-APIC-edge timer 1: 3 0 0 0 0 0 0 0 IO-APIC-edge i8042 8: 1 0 0 0 0 0 0 0 IO-APIC-edge rtc 9: 0 0 0 0 0 0 0 0 IO-APIC-level acpi 12: 4 0 0 0 0 0 0 0 IO-APIC-edge i8042 14: 476 92736034 560949599 89233642 0 0 0 0 IO-APIC-edge ide0 66: 81 0 0 0 0 0 0 0 IO-APIC-level ehci_hcd:usb1, uhci_hcd:usb2, uhci_hcd:usb4 74: 153 62468419 147960075 25257462 0 0 0 0 IO-APIC-level uhci_hcd:usb3, uhci_hcd:usb5 82: 1054378386 0 0 0 0 0 0 0 PCI-MSI eth0 169: 8343 1516025027 954152248 6501060 0 757271678 1872714173 2565826 IO-APIC-level megasas NMI: 28336831 18526902 35866900 13915052 25165724 26928152 21827791 19303613 LOC: 1408788527 1408756844 1408788059 1408788084 1408788124 1408787843 1408787972 1408787711 ERR: 0 MIS: 0
中断的最高计数仍然平均为:
1872714173 interrupts / 83014987.85 seconds = 23 intr/s
这根本不可怕。 就这些而言,这些统计数据完全可以接受。 在繁忙的系统中,7500 intr / s的峰值也是可以接受的。
无论是什么导致你的结论是中断是一个相关的指标,我会退后一步并重新考虑。 这些往往是一个问题的效果(完全不同的问题),而不是问题的唯一原因。 只有想到的情况是在公共汽车上的一些stream氓设备。
如果您有sar报告,请查找在性能较差(运行队列?分页?磁盘I / O?)时出现峰值的其他度量标准,然后从此处重新开始分析。
中断问题是系统CPU占用率过高的原因之一,如果你在mpstat输出中看起来不是很高的%irq值,那应该没问题。
如果担心中断在CPU之间分布不均衡,则需要启用irqbalance守护进程或通过/ proc / irq / * / smp_affinity手动调整
更多关于: http : //honglus.blogspot.com/2010/01/troubleshooting-high-system-cpu-usage.html http://honglus.blogspot.com/2011/03/tune-interrupt-and-process- CPU-affinity.html
您应该启用irqbalance守护程序来帮助在服务器上的可用CPU上分配定时器中断。 运行/sbin/service irqbalance start并稍后检查系统。