高负载是否会导致系统重新启动?

假设系统是一个红帽子变体,x86架构。 假定没有冷却问题。

机器上的负载是否可能导致重新启动?

我明白,一台机器当然会变得没有反应。 但它可以重新启动吗?

如果是这样,这是怎么发生的?

这里没有足够的细节…

但也许,也许不是…这取决于负载的性质和产生的东西。 高负载本身不会导致系统重新启动,但可能表明可能导致意外关机的其他一些主要问题。 例如,运行负载为80的高事务邮件服务器或数据库服务器与RAID控制器locking的系统完全不同。

最简单的例子可能是存储。 在存储连接丢失或RAID控制器故障之后,负载立即上升,可能会在繁忙的系统上轻松地将系统负载推至100+。 系统可能会在一定程度上保持可ping通状态,但I / O操作可能会失败。 即使TCP / IP堆栈在内存中并且可用,某些命令可能会停止工作。

所以在这种情况下内核恐慌是可能的,或者是系统或应用程序失速。 在高质量的硬件上,可能会有一个看门狗定时器来热启动服务器。 惠普和自动服务器恢复(ASR)function或VMware的HA虚拟机监控可以采取这一行动。

它当然可以,但是自动重启通常与硬件/软件问题(如过热或内核错误)相关联。 所以重负载可能导致过热而导致重启。 无论如何,您应该调查日志或内核转储以查找确切原因。

我认为答案是不,自己的高负载不会导致系统重新启动。 这将是一些硬件问题或一些描述的软件问题。 即使它在高负荷下总是失败,也会是高负荷引发其他问题。 我知道这不是一个很大的帮助,但它确实回答了我猜的问题:-)

当执行“重新启动”或等效的系统调用被调用时,系统软重启 。 如果你没有任何forms的看门狗触发重启,它将不会发生。

但肯定和种硬重启/重置可能会发生硬件问题。

在一个理智的系统上,重启不会因高负载而发生。 看看dmesg,/ var / log / messages来追踪问题。

我曾经有过几次这样的事情。

我有三种不同types的问题,负载比机器devise的要高。

  1. 令人难以置信的减速

在这种情况下,系统会被窃听,因为它必须快速地来回交换内存到磁盘。 这将使服务器无响应,直到问题解决。 如果你一段时间不需要服务器,它可能会终于恢复正常。 如果内存不足,可能会进入问题2,或者内核最终决定终止一个进程(也许是因为一个malloc()返回NULL ,程序员没有检查这种情况,你得到一个SEGV …)

  1. 总locking

这就是我所说的负载达到内核临界点的通常结果。 内核甚至无法为自己分配内存缓冲区的地方。 如果你有一个大的(足够的)交换文件,这是很less见的,但是这可能是你的进程不停地分配越来越多的内存。 (作为一个在我自己的代码中偶尔发生的开发者,如果我没有及时赶上它,我将不得不强制重启,因为我将无法停止进程并释放内存… IRIX有一些自动杀死这样的stream氓程序,我认为这是非常酷的。)

  1. “自动重新启动”

现在我有两个自动重启的情况。 在一个案例中,我曾经在一些公司(后来)使用VPS,当您尝试使用太多的内存时,VPS系统会杀死整个机器! 所以你的电脑会被强行closures。 我仍然看到其他VPS类似的行为。 然而,现代的更可能会让内核杀死一个进程,因为它要求太多的内存。 所以这个过程会下降。 VPS本身仍然会运行…但是没用(没有守护进程运行…)

在我的硬件上,我有这个自动重启的问题。 通常是因为两个原因:过载或访问一个硬件不正确(虚假软件)或太快(这也可能被视为不正确的,我猜…)所以我有一台电脑,只是一会儿就重新启动如果我的负担太高,太久了。 我不知道为什么会发生这种情况,但从那以后我又得到了一台不同的电脑,并没有再次遇到这个问题。

而且我也有其他的自动重新启动的地方访问video板“不正确”会以某种方式发送“硬件”重置到主板。 这也会导致自动重启。 如果您的计算机上有这样的事情(也许是因为与驱动程序“轻微”不兼容),那么它也可以自动重新启动…

在没有“看门狗”软件的系统上,自发重启最有可能的原因是与硬件有关,即组件中的散热问题或功率问题。 如果内部传感器报告温度超过某个特定点,现代硬件通常会紧急断电。 组件中的电源问题可能会触发电源复位(更有可能会烧毁保险丝或电容器),否则可能会导致发热问题回到首位。

像其他答案已经指出,高负荷可以触发这些情况。 问题的根源很可能是一个没有完全失败,但没有达到完整规范的组件。 例如,一个不够酷的CPU散热器。 (你有一个工作….)

如果问题是软件等,Linux往往比自发的重启恐慌更多。留下你一个很好的屏幕,你可以search数据,找出问题的出处。 检查你所有的日志。

我的经验说,检查硬件,特别是与热量有关。 find您的硬件监测软件。 确保软件写入日志。 运行沉重的负载。 寻找与关机一致的尖峰。 重置前很可能会出现峰值,重置后仍会上升