双CPU服务器运行一个失败?

现代服务器上的双CPU实际上是否提供冗余? 如果出现故障,服务器可以重新启动并运行在其余的CPU上?

在过去,我遇到了CPU 0一直存在的情况,所以如果CPU 1出现故障,它将很好地重启,但是如果CPU 0出现故障,则必须将CPU 1物理地交换到CPU 0插槽。 我希望这个限制不再存在于现代的双CPU服务器中,但是想确认一下。

惠普实际上告诉我,双CPU不提供任何冗余,因为它们都必须存在,但不确定是否正确。

现代服务器上的双CPU实际上是否提供冗余?

是的,他们可能会。 例如, 处理器指令重试在Power系统上可用,并且能够通过重试在执行期间失败的指令(可能在不同的处理器上)从失败的处理器恢复。

但是,这不适用于Intel或AMD等低端服务器。

如果一个失败,服务器可以重新启动,并在其余的CPU上运行?

是的,只要服务器硬件能够正确检测并从故障中恢复。 我在IBM英特尔服务器方面有很多经验,他们对从故障处理器恢复并允许系统从其他套接字启动相当不错。

现代服务器上的双CPU实际上是否提供冗余?

没有。

如果一个失败,服务器可以重新启动,并在其余的CPU上运行?

可能。 依靠。 如果它已经足够死了以至于没有看到,那么Bios可能会假定只有一个CPU进入,这可能是受支持的(主要是),尽pipe你可能会丢失RAM访问(取决于哪个CPU – 某些path通过每个CPU的一半RMA )。

这一切都取决于如何处理的情况下,如果CPU不在那里 – 这是一个实施细节。

也就是说,这对于CPU在合适的服务器中发生故障的情况极less见。