在双CPU服务器上,一个CPU运行比另一个运行正常吗?

我有一台运行带有libvirt的Linux的双Opteron服务器来托pipe多个虚拟机。 虚拟机工作正常,服务器进程正常,但我注意到一个CPU总是运行大约69C(70C的节stream),另一个运行大约15C。

这对我来说不正常? 难道他们两人的体温都差一点吗?

我不知道如何进一步dianose。 也许在其中一个CPU上没有足够的导热膏?

编辑:主板是华硕KGPE-D16和双Noctua NH – U9DO风扇冷却。

请注意,我认为温度可能会高于环境温度,而不是绝对值? 当服务器闲置时,CPU温度降至2C和13C。 我从这里使用lmsensorsconfiguration

问题最终成为一个不合适的散热器。 也许不合适是不正确的描述。 原来,你必须在散热片上放置导热膏,而不是散热片上的塑料盖。

在这里输入图像描述

卸下塑料盖后,CPU很好,很酷,谢谢大家!

根据我的经验,一个案例中的配对组件在不同的温度下运行是正常的,因为每个地方的气stream都不一样。 下面是我的可乐盒的硬盘温度图。 驱动器是镜像的,所以它们的工作负载几乎是一样的。

过去一年的HDD temps的munin图

正如你所看到的,他们追踪对方,但他们不一样; 他们平均也只有6C。 无论您的传感器是报告绝对温度还是超温,在负载下的温度差异是非常严重的错误。 如果你有信心数据是正确的,那么考虑到静态差异降到10C,这是我看到由于气stream的差异,我怀疑散热片不好。

不是这样。 除非你有一些与气stream有关的严重问题。 或者其中一个冷却器是坏的。 温度会有所不同 – 但不是那么多(70对15摄氏度)。

考虑到15度的低度,我认为(一)你的传感器是closures的(你真的把服务器存储在一个凉爽的房间?)。

我也会假设其中一个CPU完全没有工作,不pipe出于什么原因。

小的差异是正常的。 有些大一些的可能是(我想到的是气stream)。 但是这里我们谈论一个正在冷却。

这可能是冷却或不均匀的加载(考虑到温度差异,你的情况可能是不均匀的加载)。 你应该使用像prime95这样的东西来平均加载所有的核心,看看临时工还是不一样的。 如果他们不那么你需要平衡虚拟机,检查你的应用程序是multithreading和繁忙。 如何做到这一点取决于你的软件和个人的工作量,所以超出了问题的范围。 请记住,如果没有足够的负载来完成一个cpu / core,那么这样做并没有真正的优势,事实上,您的虚拟机可能会故意避免使用第二个cpu,以便它可以进入多节省电模式-cpu系统。

如果你已经缩小到冷却。 高达10C的小差异可能太less(或太多)导热膏。 更大的差异表明CPU冷却器之间的重大问题或差异。 这可能是一个阻止气stream,散热片被打散,等等

我不得不同意,有缺陷的温度。 传感器,因为15C只有59F! 除非电脑处于非常寒冷的数据中心,否则我会想象环境温度会高于59F! 您尝试将虚拟机分配给低温内核并查看是否有任何更改; 如果没有,我会高度怀疑传感器是有问题的。

你也可能想看看dmesg的输出(引导信息),看看有没有什么不寻常的地方。