服务器停止响应,在哪里看知道发生了什么?

我有一台已经运行了5个多月的服务器,并且突然停止响应。 我不能ssh进入它或其他任何东西,所以我决定重新启动,重新启动修复它。

我试图找出发生了什么,我不知道在哪里看。 我开始看/var/log但是里面有很多文件,我不确定哪一个我应该注意。 我正慢慢地经历其中的每一个,但是如果任何人都能指出我正确的方向,那就太好了。

谢谢!

我会从/var/log/messages ,这将是大多数通用输出默认的地方。 它将包括引导消息和任何内核警告。 根据问题的types,可能没有法医数据。 例如,RAM可能不会产生错误。 磁盘错误将在日志中。

SSH可能只是打破了。 不知道控制台的状态,很难说明确。 通常情况下,一个没有被突然locking的稳定的Linux机器就是一个硬件问题。 大多数硬件问题需要进一步的故障诊断

如果你能提供更多的细节,我可能会给你进一步的build议。

也许只有sshd失败了? 是PING到服务器响应? 如果你想保持你的服务(比如ssh,ftp,apache等)总是使用“monit”。

在服务器重新启动之前,您可以粘贴/ var / log / messages的输出吗?

没有检查日志文件就无法找出锁死的原因。

也是locking反复或是一个一次性事件?