如何向用户解释至强与i7 / Consumer CPU的区别

我知道这两个CPU在相同的时钟速度下,由于许多不同的因素而仍然不同,但是我意识到我没有足够的知识来解释清楚。 我认为caching和优化在其中扮演了一个不错的angular色,但是有人可以解释一下,我可以告诉我的开发者,即使内核数量和时钟速度相同,他们的MacBook Pro CPU也不如升级的VM Xeon CPU快。 如果这两个指标是相等的(或者我认为它是错误的),那么CPU是否能够在一个周期内完成更多的工作?

我知道磁盘子系统,networking等都是考虑到性能; 这只关注CPU性能。

至强至强有6个内核和12个线程,而i7有4个内核和8个线程(最多有6个内核/ 12个线程的i7,但对于笔记本电脑来说太热了)。

唯一的运行在3.0Ghz的i7是2核/ 4线程的3540M和4610M以及4核/ 8线程的3940M和4930MX–所有这些都使用DMI 2.0,其最大内存传输速率为20Gbps四个通道,所以理论上最大10GBps。

X5670实际上是2.93Ghz芯片,而不是3.0Ghz,但是具有2×6.4GT / s的QPI,可以达到25.6GB / s,实际上比在i7上可以实现更多的L2 / 3caching可用。

除了核心数量和时钟速度,caching速度和大小以及内存总线速度之外,至less还有两个因素:

  • 现代英特尔CPU可dynamic调整时钟速度以控制散热/功耗。 当只有一个进程是计算绑定的时候,他们会logging下来,运行一个内核非常“热”,而其他内核很大程度上处于空闲状态。 当多个内核忙时,时钟速度会降低。 台式机和服务器机器通常可以处理比笔记本电脑更多的热量,其中尺寸和低噪声优于原始电力。

  • Intel CPU体系结构的不同迭代在x86指令集中具有许多指令的不同实现。 对于很多指令来说,可以有不同的实现select来折衷电路复杂度,速度和功耗。 在每个内核中有几个“执行单元”可以同时执行一些指令或部分指令。 指令本身被“stream水线化”成几个步骤,不同的CPU线路将不同步地打破。 把一个核心看作有点像一个有一定数量的煎锅,燃烧器,碗,器皿,量杯和厨师的餐厅厨房 – 显然有很多折衷可以改变任何特定食物的性能订购。

虽然可能会有很多差异,如高速caching大小,内存延迟,分支预测效率等等,但基本的区别很简单 – 两个CPU需要不同的总时钟周期数来执行相同的指令序列。

那么,这是一个比较。 你没有说明i7的模型,所以我select了最接近的模型:

http://ark.intel.com/compare/71255,47920

正如你所看到的,至强已经4岁了,而i7s已经有一年左右的时间了,所以那里有更新的技术。

Mhz曾经是一件很大的事情,但是现在即使是较慢的时钟处理器,由于各种技术的原因,它们的速度也可能会超过那些速度更快的Pentium 4s(比如今天的Pentium 4s和高时钟)。 这些包括优化的指令(如SSE4.2),超线程和caching。

所以要回答你的问题,Xeon很可能会被配备i7的机器所超越,因为它更加优化(同时使用更less的功率!)。 然而 ,人们在服务器中使用Xeon的原因是因为它们的构build是为了支持比i7更高的内存,所以它们在服务器上是可取的。

不过,更新的Xeon 8s给了i7s一笔钱,并且非常适合这些types的任务。