我正在HP Proliant服务器上运行Oracle Linux 6。 它在上个星期运行良好,但是似乎早一点,所以Oracle服务停止了。 我没有重新启动服务,而是被要求重新启动服务器,但一开始我们就感到内核恐慌
首先,我得到以下的,惠普说并不重要,但我倾向于不相信他们
[Firmware Bug]:BIOS损坏了hw-PMU资源(MSR 38d为330)
ERST:无法请求用于ERST的iomem区域<0xffff88030c1dfe20-0xffff1006183bfc40>
然后内核恐慌
内核恐慌 – 不同步:试图杀死初始化!
Pid:1,comm:init没有污染2.6.39-300.26.1.el6euk.x86-64#1
呼叫跟踪:
[<ffffffff81509077>] panic + 0x91 / 0x1a8
[<ffffffff81061562>]? enqueue_entity + 0×52 / 0x210
[<ffffffff8107196b>] forget_original_parent + 0x32b / 0x330
[<ffffffff8105adbd>]? sched_move_task + 0x9d /量0x150
[<ffffffff8107198b>] exit_notify + 0x1b / 0x190
[<ffffffff81072a8e>] do_exit + 0x1fe / 0x430
[<ffffffff81072d15>] do_group_exit + 0x55 / 0xd0
[<ffffffff81072da7>] sys_exit_group + 0x17 / 0x20
[<ffffffff81514402>] system_call_fastpath + 0x16 / 0x1b
发生恐慌:切换回文本控制台
任何人都可以给我一个指向什么是甚至可能造成这个? 我完全被困在这一点上。 (系统pipe理不是我的日常工作 – 我可以让服务器运行,但内核恐慌是在我的舒适区之外)
编辑:testing以下内核
2.6.39-300.26.1.el6euk.x86_64
2.6.39-200.24.1.el6euk.x86_64
2.6.32-279.19.1.el6.x86_64
2.6.32-279.el6.x86_64
您在init中看到的第一条消息: [Firmware Bug]: the BIOS has corrupted hw-PMU resources (MSR 38d is 330)不是问题。 这是EL6和ProLiant系统的标准configuration。 但是, 可以在此处find删除消息的修复程序 。
至于疯狂的Oracle Linux内核版本,2.6.39-300.26.1.el6euk.x86-64,你可以尝试用GRUB中以前的内核启动吗?
我认为这应该是一个硬件问题,内存,CPU等。 首先尝试使用memtest从救援磁盘(cd或usb磁盘)启动,并testing几个小时。
如果你是一个幸运的人,你只需要更换内存,如果你不是…可能是你必须改变主板,CPU,… … –