如何确定系统崩溃的原因?

我的服务器每周大约崩溃一次,并没有留下任何线索。 我检查了/var/log/messages ,它只是停止logging在某个时刻,并开始在计算机发布信息,当我执行硬重启。

有什么我可以检查或软件,我可以安装,可以确定原因?

我正在运行CentOS 7。

这是我的/var/log/dmesg唯一的错误/问题: https : //paste.netcoding.net/cosisiloji.log

您可以检查/var/log/dmesg的dmesg文件,该文件正在logging内核消息。 消息日志只是logging服务和应用程序消息,如果您有内核错误,服务和应用程序将停止运行,但内核错误仍logging在dmesg中。

  • BIOS的内存testing
  • bios硬盘testing
  • 检查智能驱动器日志smartctl /dev/sda -a
  • 智能驱动器testing
  • dmesg -wH在窗口中运行

如果已经安装并启用了crashkernel/kdump ,则应该可以使用crash实用程序相对容易地检查崩溃的内核。 例如,假设你崩溃的内核转储保存在/var/crashcrash /var/crash/2009-07-17-10\:36/vmcore /usr/lib/debug/lib/modules/ uname -r /vmlinux

看看这里和这里添加的细节。