我运行一个Ubuntu 10.04(x64)作为一个web / mysql服务器。
服务器变得对SSH,Ping,HTTP等没有反应,并且物理访问机器的技术人员给我发送了这个屏幕抓图:
http://img442.imageshack.us/img442/389/img00062201012211332.jpg
从重新启动之前连接的显示器(情况已修复)。 我不知道这个信息保存在什么日志里,因为在重新启动后检查日志后我找不到文本。
任何人都可以帮助我调查发生了什么事情,并确保它不会再发生?
谢谢
内核恐慌可能来自一堆原因,通常是模块问题(不适合你的硬件的驱动程序)或硬件问题。
在你的情况下,如果问题是不可重复的,它更可能是硬件来源。
它可能是内存(糟糕的内存不总是容易识别)。
我将启动服务器 – 并在grub屏幕(启动后)select“memtest86”选项。 内存testing需要连续运行数天。
如果3天后没有错误,内存也许是好的。
如果你没有其他的信息(就像ring0说的那样,它不会被保存到磁盘上),那么你就没有其他的东西可以做了。
如果你想积极主动,或者随机发生几次,你可以尝试LKCD来捕捉核心转储。 http://lkcd.sourceforge.net/
我不知道你有多less内存,但即使memtest86几个小时也是有益的。 显然不会发现真正罕见的错误。
我也build议你添加kernel.panic = 5 /etc/sysctl.conf。 如果内核再次挂起,会导致服务器在5秒后自动重启。
最后,我认为你应该总是有一些熄灯pipe理。 然后,您可以login并复制该消息并自己重新启动服务器。
当服务器运行时负载太高/处理时间过长时,我已经看到这样的崩溃。 通常要检查你的机器上发生了什么,我build议在你的服务器上安装一个监视框架,例如munin,这将有助于分析以防万一发生这种情况。
好的,这是来自内核的堆栈跟踪。 我不是内核专家,但其原因涉及到中断,irq(中断)平衡以及可能的PIC。 这在笔记本电脑硬件上比服务器上的东西更常见。 破碎的笔记本电脑解决scheme是启动一个内核选项noapic。
这可能听起来有点不对劲,但是我在使用64位服务器的服务器上运行Ubuntu x64时遇到了问题。 我经常遇到这些相同的错误和后续的“冻结”问题。 它试图删除驱动程序,加回驱动程序,花费数小时查看错误,没有任何帮助。 我终于通过安装一个32位版本的Ubuntu来解决它。 它的工作,我不需要64位,所以我让它骑。 如果你需要64位,这不是一个好的解决scheme,但它可能会给你一个探索一下的道路。 也许查看运行Ubuntu的服务器,看看是否有围绕它的兼容性问题。 祝你好运。