Linux服务器挂起,在哪里寻找可能的原因?

不知道确切的原因,Linux服务器挂了好几次。 我应该看哪个文件或日志? 服务器响应ping ,但我不能ssh到它。 而当我插入一个显示器,它没有任何反应。 任何想法?

内核挂起很难debugging,因为在崩溃的情况下屏幕上没有显示oops消息,如果你真的很幸运,你会看到在/ var / log / messages中的东西,因为在挂起整个系统与syslog守护进程挂起时,什么都不会写在这些文件里面。

所谓的挂起可以像由内存或cpu争用引起的暂时性能问题一样简单,使用低效率的algorithm或者可能像死锁一样复杂。因此像上面提到的,如果你真的很幸运

1:检入/ var / log / messages或者运行dmesg得到一些指针2:如果你的系统是挂着的,那么configurationkdump和sysrq键一起来知道确切的问题。

欲了解更多信息,请参阅http://people.redhat.com/anderson/crash_whitepaper/