LInux:我如何诊断/隔离什么导致“随机”挂起和自发的重新启动?

所以,我并不是在猜测原因是什么(尽pipe我的钱是在NVIDIA的车手身上),我从哪里开始寻找一些事实呢?

我已经多次通过/ var / log了,但是里面有很多东西,我还不能发现重要的东西。

背景:短版

我刚刚从WinXP迁移到Ubuntu Karmic。

从那以后,我发生了一系列看似随机的碰撞,

  • 自发重启
  • 一个完整的locking与我的USB键盘和鼠标变得没有反应(下到他所有的LEDclosures)。 此外,当发生这种情况时,我通常也无法ssh到框。

我已经做了大量的search,Nvidia似乎是主要的嫌疑犯,但我不知道从哪里开始寻找究竟是什么原因。

build议?

背景:长版

有时,我可以整整一个星期没有崩溃,然后有2个5天。

为了消除可能的嫌疑人的动机,我随着时间的推移做出了一些改变而无济于事:

  • 最初我使用KVM进行虚拟化,现在我使用VirtualBox OSE
  • 我有NFS在内核中运行,但现在使用Samba
  • 我正在使用Compiz,但后来closures了
  • 我已经从64位Karmic滚到32位(出于其他原因)
  • 我试过Ubuntu,Kubuntu和Xubuntu。 每次同样的麻烦。
  • 我将Nvidia驱动从版本185推回到版本96(NVIDIA Linux x86 Kernel Module 96.43.13 Thu Jun 25 18:42:21 PDT 2009)。 这似乎减less了错误的频率。

就当时的运行而言,这可能会有所不同。 以下是常见的,但不一定每个崩溃都运行:

  • Firefox 3.5
  • 带有1个或2个Windows XP虚拟机的VirtualBox OSE
  • Skype的
  • Rhythmbox或Exaile

我的硬件是2 – 3岁:

  • 酷睿2双核6300
  • 4GB内存
  • 一些品种的英特尔主板的那个年份
  • 采用NVDIA GeForce 7300 GS芯片组的华硕双头显卡
  • 2个SATA硬盘
  • 双显示器(因此我依靠专有的NVIDIA驱动程序)

我一直与我的系统更新。

希望上面的数据可能会提示某人提出一个值得研究的特定types的日志或configuration。

更新
内存似乎很好
以下每个build议将重新发布超级用户

Linux和其他类似Unix的系统比windows更加灵敏。 我会运行memtest86并检查内存

这样的问题确实可能是由硬件故障引起的(如果您怀疑nvidia驱动程序,也许显卡有硬件错误?)

  • 如果您启用了温度监控(使用sensors-applet / lm_sensors),是否有高读数?
  • 你有超频吗?
  • 你有没有在Windows下奇怪的崩溃/挂起/重新启动?

如果系统挂起,有些事情要检查:

  • 键盘指示灯是否闪烁? AFAIK,这将表明一个内核恐慌(即内核崩溃)
  • 你可以用Ping到系统吗?
  • 使用SysRq键组合(必须预先启用)来查看是否可以从系统得到一些响应
  • 重新启动后,检查日志文件(/ var / log / syslog,/var/log/Xorg.0.log)最后的消息

也许这是一个硬件问题? 我有破碎的video卡挂起电脑没有留下任何痕迹的内核日志的经验。 要隔离问题,请尝试使用合成的一些LiveCD,或者更好:玩一个3D游戏;-)。 请参阅: UL论坛上的相关文章