确定系统重新启动的原因

我有一个运行在VMWare Hypervisor上的Fedora 13虚拟机。 上午6点左右,它神秘地重新启动,搞砸了我正在运行的一些长时间运行的数据导入过程。 我一直在检查,但我很难找出为什么重新启动。 找出重新启动的原因的最佳方法是什么?

机器处于locking的服务器机架中,因此不太可能有人手动重新启动硬件。 我是唯一一个通过SSH访问机器的人,所以不太可能有人重新启动虚拟机。 在Hypervisor上运行的其他虚拟机没有重新启动,因此不太可能是由于电源故障或重启整个硬件造成的。

在发生重启时运行who -b告诉我:

 ~$ who -b system boot 2011-12-22 06:02 

运行crontab -l显示不会触发重新启动的cron作业。

在Hypervisor的vSphere客户端中查看历史资源使用情况图表显示,在重新启动之前,机器的CPU使用率至多有5%,因此没有任何不正常的负载。

不幸的是,在重启时检查/ var / log / messages只显示:

 Dec 22 03:50:01 myserver pcscd: winscard.c:309:SCardConnect() Reader E-Gate 0 0 Not Found Dec 22 03:50:01 myserver pcscd: winscard.c:309:SCardConnect() Reader E-Gate 0 0 Not Found Dec 22 03:50:01 myserver pcscd: winscard.c:309:SCardConnect() Reader E-Gate 0 0 Not Found Dec 22 03:50:01 myserver pcscd: winscard.c:309:SCardConnect() Reader E-Gate 0 0 Not Found Dec 22 06:02:38 myserver kernel: imklog 4.4.2, log source = /proc/kmsg started. Dec 22 06:02:38 myserver rsyslogd: [origin software="rsyslogd" swVersion="4.4.2" x-pid="1138" x-info="http://www.rsyslog.com"] (re)start Dec 22 06:02:38 myserver kernel: Initializing cgroup subsys cpuset Dec 22 06:02:38 myserver kernel: Initializing cgroup subsys cpu Dec 22 06:02:38 myserver kernel: Linux version 2.6.34.7-56.fc13.x86_64 ([email protected].fedoraproject.org) (gcc version 4.4.4 20100630 (Red Hat 4.4.4-10) (GCC) ) #1 SMP Wed Sep 15 03:36:55 UTC 2010 Dec 22 06:02:38 myserver kernel: Command line: ro root=/dev/mapper/VolGroup-lv_root rd_LVM_LV=VolGroup/lv_root rd_LVM_LV=VolGroup/lv_swap rd_NO_LUKS rd_NO_MD rd_NO_DM LANG=en_US.UTF-8 SYSFONT=latarcyrheb-sun16 KEYTABLE=us rhgb quiet Dec 22 06:02:38 myserver kernel: BIOS-provided physical RAM map: 

所以基本上,大约2个小时没有任何事情发生,然后机器突然重新启动。

这是否意味着内核崩溃? 我如何确认? 还有我应该看的其他日志吗?

如果有内核问题,并且你有内核转储设置比应该有一个转储文件的地方。 当然,你需要在崩溃前设置! 您现在可能已经知道,ESX / i在结构上与Linux相似,因此日志文件将位于大致相同的位置。 一个好的概述在这里, http://www.vmwarewolf.com/which-esx-log-file/还有各种不同的parsing/查看ESX / i日志文件的方法。 http://www.simonlong.co.uk/blog/2010/06/03/vmware-esxi-4-log-files/