几天前,我pipe理的服务器在正常运行时间超过400天之后就感到恐慌。 我重新启动它,它工作了两天左右,然后它碰到一个“oops:cpu#n卡住了61s”为n的各种值。 再次重新启动,今天原来的内核恐慌再次出现。 跟踪(手动重新input,跳过地址):
Kernel panic - not syncing: Fatal exception in interrupt Pid: 0, comm: swapper Tainted: GD 2.6.32-41-server #89-Ubuntu Call Trace: <IRQ> panic oops_end die do_general_protection ? consume_skb general_protection ? put_page skb_release_data __kfree_skb consume_skb dev_kfree_skb_any sky2_tx_complete sky2_status_intr ? __queue_work sky2_poll net_rx_action __do_softirq ? handle_IRQ_event call_softirq do_softirq irq_exit do_IRQ ret_from_intr <EOI> ? mwait_idle ? atomic_notifier_call_chain ? cpu_idle ? start_secondary RIP put_page
操作系统是Ubuntu 10.04.4 x64。 由于它一直工作,没有任何变化之前,恐慌,我正在考虑一些硬件故障。 在最后一次重新启动之前,我做了一个完整的memtest,并通过了,以及一个完整的fsck只是为了确保。 由于恐慌与sky2(marvellnetworking控制器)有关,它可能是一个很好的问题? 有没有我忽略的东西? 考虑到错误之间一切正常工作(日志没有错误,没有丢包,没有减速)。
感谢任何指针
硬件问题很可能。 风扇堵塞和/或故障,温度过高,内存不良,内存不足,CPU运行exception,电源接近死机。