为什么我的裸机16×2.93GHz核心计算机性能比Vx4x 2.5GHz核心差？

我已经写了一个multithreading软件，每天做一堆模拟。这是一个非常耗费CPU资源的任务，我一直在云服务上运行这个程序，通常是每个核心1GB的configuration。

我正在运行CentOS 6.7， /proc/cpuinfo给我说我的四个VPS内核是2.5GHz。

 processor : 3 vendor_id : GenuineIntel cpu family : 6 model : 63 model name : Intel(R) Xeon(R) CPU E5-2680 v3 @ 2.50GHz stepping : 2 microcode : 1 cpu MHz : 2499.992 cache size : 30720 KB physical id : 3 siblings : 1 core id : 0 cpu cores : 1 apicid : 3 initial apicid : 3 fpu : yes fpu_exception : yes cpuid level : 13 wp : yes flags : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush mmx fxsr sse sse2 ss syscall nx pdpe1gb rdtscp lm constant_tsc arch_perfmon rep_good unfair_spinlock pni pclmulqdq ssse3 fma cx16 pcid sse4_1 sse4_2 x2apic movbe popcnt tsc_deadline_timer aes xsave avx f16c rdrand hypervisor lahf_lm abm arat xsaveopt fsgsbase bmi1 avx2 smep bmi2 erms invpcid bogomips : 4999.98 clflush size : 64 cache_alignment : 64 address sizes : 40 bits physical, 48 bits virtual power management:

随着汇率的上涨，我的VPS开始变得更加昂贵，而且我对于使用过的裸机服务器达成了“很大的交易”。

我购买了四个HP DL580 G5 ，每个四个Intel Xeon X7350。基本上，每台机器都有16x 2.93GHz的核心和16GB，以保持像我的VPS云。

 processor : 15 vendor_id : GenuineIntel cpu family : 6 model : 15 model name : Intel(R) Xeon(R) CPU X7350 @ 2.93GHz stepping : 11 microcode : 187 cpu MHz : 1600.002 cache size : 4096 KB physical id : 6 siblings : 4 core id : 3 cpu cores : 4 apicid : 27 initial apicid : 27 fpu : yes fpu_exception : yes cpuid level : 10 wp : yes flags : fpu vme de pse tsc msr pae mce cx8 apic mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm pbe syscall lm constant_tsc arch_perfmon pebs bts rep_good aperfmperf pni dtes64 monitor ds_cpl vmx est tm2 ssse3 cx16 xtpr pdcm dca lahf_lm dts tpr_shadow vnmi flexpriority bogomips : 5866.96 clflush size : 64 cache_alignment : 64 address sizes : 40 bits physical, 48 bits virtual power management:

基本上这似乎是一个很大的交易，因为我可以停止使用VPS来执行这些批处理作品。现在这是奇怪的东西…

在VPS上，我一直在使用每个核心1.25线程，就像我在裸机上一样。（额外的0.25线程是为了补偿networking使用造成的空闲时间。）
在我的VPS上，总共使用44x 2.5GHz内核，我每分钟可以获得近900次仿真。
在我的DL580上，总共使用64x 2.93GHz内核，我只能每分钟获得300次模拟。

我了解DL580有一个较旧的处理器。但是，如果我为每个内核运行一个线程，而裸机服务器的核心速度更快，为什么它比我的VPS差呢？

我没有在任何服务器上发生内存交换。

TOP说我的处理器运行在100％。我的平均负载为18（VPS为5）。

这会是这样，还是我错过了什么？

运行lscpu给我1.6GHz的裸机服务器。这也出现在/proc/cpuinfo 。

这些信息是否正确？或者是否与某些不正确的电源pipe理有关？

 [BARE METAL] $ lscpu Architecture: x86_64 CPU op-mode(s): 32-bit, 64-bit Byte Order: Little Endian CPU(s): 16 On-line CPU(s) list: 0-15 Thread(s) per core: 1 Core(s) per socket: 4 Socket(s): 4 NUMA node(s): 1 Vendor ID: GenuineIntel CPU family: 6 Model: 15 Stepping: 11 **CPU MHz: 1600.002** BogoMIPS: 5984.30 Virtualization: VT-x L1d cache: 32K L1i cache: 32K L2 cache: 4096K NUMA node0 CPU(s): 0-15 [VPS] $ lscpu Architecture: x86_64 CPU op-mode(s): 32-bit, 64-bit Byte Order: Little Endian CPU(s): 4 On-line CPU(s) list: 0-3 Thread(s) per core: 1 Core(s) per socket: 1 Socket(s): 4 NUMA node(s): 1 Vendor ID: GenuineIntel CPU family: 6 Model: 63 Stepping: 2 **CPU MHz: 2499.992** BogoMIPS: 4999.98 Hypervisor vendor: KVM Virtualization type: full L1d cache: 32K L1i cache: 32K L2 cache: 256K L3 cache: 30720K NUMA node0 CPU(s): 0-3

处理器的进步，时钟速度和IPC的计算可能使得几乎不可能尝试合理比较十年前的CPU和现代的CPU。不仅每个周期的指令会有所不同，而且更新的处理器具有专用于复杂计算的指令集（英特尔已经添加了AES-NI作为示例），由于这些因素，时钟速度不再是合理的比较器多核心与超线程…）。有了足够的时间和耐心，你一定能弄清楚有多less旧的proc等于一个新的proc，但计算最终会说它更便宜，更快地购买一个新的CPU。

Iwillnotexist Idonotexist评论扩展了这个答案：

@GlaucoCattaliniLins X7350基于Core 2微架构。事实上，它可以与Core 2 Quad相媲美（自从你上次听说这些以来，它已经有多久了？）。它太老了，它不支持SSE4 +，AVX（2），FMA或AES指令，所以如果你的模拟是数值的话，那么它就会受到> 2倍的惩罚，并且AESencryption速度会受到更多的影响。最后，英特尔从Core 2开始发布了6个微架构改进，并且每个都增加了CPU并行或不按顺序运行更多指令的能力，即内存带宽。 – Iwillnotexist Idonotexist

@GlaucoCattaliniLins相比之下，您的VPS服务器支持FMA，所以它至less与Haswell微架构一样新。 FMA指令允许我们进行乘法和加法二合一，并且Haswell中的所有内容（指令解码器，重sorting缓冲器，分支预测器，内存带宽，ALU）都已经被调整，以便双向vectorFMA可以保持馈送。 Haswell可以在一个时钟周期内维持：1）两个8元素的vector运算，forms为float d = a + b * c，2）两个32字节的加载（a和b）和3）字节存储（d）。这是惊人的调整。 – Iwillnotexist Idonotexist

我不想听起来很糟糕，强调一些在这里应该是显而易见的东西，但是你比较了从2014年的高端服务器处理器到2007年的高端服务器处理器。

我不认为这需要更多的解释。

HP ProLiant DL580 G5现在价格便宜，这是有原因的。它们庞大，速度慢，缺乏许多在现代服务器中所需要的function。我在2009年卖掉了我的最后一个。这是一个不好的购买，如果你被迫购买二手设备，你最好用Nehalem或Westmere CPU系列的CPU。

另外，您购买的服务器在功耗方面效率非常低，所以它们的操作成本很高。

看起来好像您的物理服务器正在节能模式下运行，缩减了您的CPU时钟速度。你会想要进入BIOS（在启动时按F9），并将服务器重置为出厂默认设置（ 谁知道还有什么修改默认？ ）

在这里输入图像描述