我有一个四核心,我已经发现在munin(监控中断和上下文切换),我的中断和上下文切换尖峰到25k每秒,而平均为250一段时间。 不知道发生了什么,也不知道这是什么意思,除了根据我的监测工具,这是一个exception。 这发生在我的一个openVZ虚拟容器中。 注意:与此同时,加载到2.5,CPU使用率在同一点110%的系统,15%的用户和100%的IOwait。 我在主机上附加了/ proc / interrupts的输出。 CPU0 CPU1 CPU2 CPU3 0: 48039108 56660082 56431151 51696624 IO-APIC-edge timer 1: 0 3 0 0 IO-APIC-edge i8042 4: 4 4 1 3 IO-APIC-edge serial 8: 1 0 0 0 IO-APIC-edge rtc 9: 0 0 0 0 IO-APIC-level acpi 12: 4 0 0 0 IO-APIC-edge i8042 50: […]
我想知道以前是否有人看到过这个问题,也许可以解决一些问题。 我正在运行红帽企业版Linux 6.1,在纯文本服务器configuration中完全更新,并且kacpid和kacpi_notify进程分别占用了CPU时间的70%和〜15%。 我已经将问题追溯到看起来像是疯狂的ACPI中断: [root@centauri ~]# cat /proc/interrupts | grep acpi; sleep 5; cat /proc/interrupts | grep acpi 9: 447753 0 32693472 0 IO-APIC-fasteoi acpi 9: 447753 0 32850749 0 IO-APIC-fasteoi acpi 超过30k中断一秒,显然是错误的。 另外,如果我使用非常相似的硬件configuration检查另一台服务器,那么这个特定中断的中断计数总是为零。 这两个系统都运行禁用超线程的Core i7 2600K处理器。 我已经尝试重置BIOS中的所有默认值,但没有运气。 任何想法可能会导致如此之多的中断? 如果我用acpi = off启动,这个问题就会消失。 除了电源控制,在ACPI禁用的情况下运行系统还有什么缺点吗?
我们在IBM x3550服务器上运行3.13内核(Ubuntu 14.04)。 我想我可能已经发现了一个更改eth0互联网接口的IRQ关联的bug,该关联对应于此设备上的IRQ 43。 证据:最初: root@serv2:/proc/irq/43# cat /proc/interrupts | grep eth0 CPU0 CPU1 CPU2 CPU3 CPU4 CPU5 CPU6 CPU7 43: 88888373 88905075 1148856189 88905192 88064077 88904900 88873957 88873938 PCI-MSI-edge eth0 IRQ 43应该分配给CPU7: root@serv2:/proc/irq/43# cat smp_affinity_list 7 几秒钟后等待: root@serv2:/proc/irq/43# cat /proc/interrupts | grep eth0 CPU0 CPU1 CPU2 CPU3 CPU4 CPU5 CPU6 CPU7 43: 88888373 88905075 […]
我启用IOAT,但似乎没有数据传输使用DMA的networking: 我在BIOS中启用了IOAT。 CPU是Intel(R)Xeon(R)CPU E5-2650 v2 @ 2.60GHz。 我在ubuntu 14.04(3.11.0-26-generic)中加载了这个模块。 这是dmesg中的相关消息: dmesg | grep ioat [ 7.314760] ioatdma: Intel(R) QuickData Technology Driver 4.00 [ 7.315893] ioatdma 0000:00:04.0: irq 186 for MSI/MSI-X [ 7.317850] ioatdma 0000:00:04.1: irq 187 for MSI/MSI-X [ 7.318319] ioatdma 0000:00:04.2: irq 188 for MSI/MSI-X [ 7.323282] ioatdma 0000:00:04.3: irq 189 for MSI/MSI-X [ […]
我们有一台三天的Idacentre A740 AIO电脑。 (Windows 8.1专业版) 系统是最新的。 在我们启动电脑并“不要”之后,系统中断约占CPU时间的40%。 试图find造成我们使用xperf和wpm的原因。 我需要帮助来了解xpref的输出。 我认为与HAL.dll(或ACPI.sys?)的问题任何build议,如何解决这个问题? 谢谢
操作系统:Centos7 我禁用中断审核, ethtool -C eno2 rx-usecs 0, 然后使用tcpdump开始捕获该接口。 转储文件正在按预期增长。 也许一个小时后,tcpdump进程仍在运行,我可以看到接口正在接收数据包(通过ifconfig),但数据包不再被tcpdump捕获。 我停止tcpdump(显示没有丢弃)&重新启动,但仍然没有数据包被捕获,即使ifconfig显示接口仍在接收数据包。 所以我启用了中断审核, ethtool -C eno2 rx-usecs 20, 并再次启动tcpdump …数据包被捕获。 然后,我禁用中断审核,再次启动tcpdump,并且数据包仍然被捕获。 一段时间后检查,发生同样的问题…没有数据包被捕获 – 即使接口正在接收数据包。 我注意到ifconfig显示'NIC'每次我意识到数据包不再被捕获时就丢弃了一个额外的数据包。 任何帮助将是伟大的。 谢谢。
我们正在RHEL 6.7上运行JBoss EAP中的一个应用程序,并且在集群中的性能差异很大。 在8个虚拟机中,大多数会在〜200ms内响应请求,但是其中一个或两个会有2或4秒的响应时间。 研究这个问题,我们从vmstat观察到,速度较慢的服务器每五秒报告几十万个系统中断,而在快速服务器上则几千个。 移动到/ proc / interrupts,我们看到中断是TLB Shootdowns。 他们每隔几秒就有10万到20万的数据。 我已经做了一些阅读,以了解这些是什么( 我最喜欢这个描述)。 但是我不知道下一步该去哪里。 为什么TLB中断被发出?
irqbalance是否添加内核模块? 用户空间守护进程如何将中断分配给不同的处理器? 如果是这样做的用户空间进程,会不会内核到用户空间的上下文切换延迟中断处理?
发生停电,服务器正常重启。 服务器是宾馆的数据库服务器,连接到使用光纤的ISP。 在重新启动,networking上市,而不是默认的专用networking。 不得不拆掉防火墙。 不能外面,也不能内部。 任何想法如何我可以避免这一点,在下一次停电? 在此先感谢,希望我给了足够的信息。
我正在尝试确定我在几个运行在vmware esxi4上的虚拟服务器时所经历的中断的原因。 我有12个虚拟服务器分布在2台esxi主机上,我只注意到其中3个虚拟服务器的问题。 有问题的虚拟服务器是一个ftp服务器和两个dns服务器。 当发生中断时,我可以login到vSphere客户端并使用有问题的虚拟服务器的控制台,但是在停机期间(其持续时间从一分钟到一小时),虚拟服务器似乎经历了非常慢的networking传输速度按照每秒0-3千位的顺序,或根本没有连接。 (他们所在的数据中心有100MB连接) 机器上的操作系统是debian lenny,并定期更新。 我一直无法确定这些中断的原因,他们真的开始困扰我,所以任何帮助确定这些问题的原因将不胜感激。 esxi的日志文件只包含 Feb 08 13:16:57.981: mks| SOCKET 8 (105) recv error 104: Connection reset by peer Feb 08 13:16:57.981: mks| SOCKET 8 (105) destroying VNC backend on socket error: 1 Feb 08 13:16:57.998: mks| MKS: Base polling period is 1000000us Feb 08 20:28:14.774: mks| MKS: Base polling […]