在HPC集群中使用i7“玩家”cpu

我正在运行WRF天气模型。 这是一个密集的,高度并行的应用程序。

我需要为此构build一个HPC群集。 我使用10GB infiniband互连。

WRF并不取决于核心数量,而是取决于内存带宽。 这就是为什么一个核心的i7 3820或3930Kperformance比高级的Xeons E5-2600或E7更好

似乎大学使用Xeon E5-2670 WRF。 它花费大约1500美元。 Spec2006 fp_rates WRF台式显示器580美元i7 3930K与1600MHz RAM执行相同的操作。

有趣的是,i7可以处理高达2400MHz的ram,为WRF做了很大的提升。 那真是胜过了至强。 功耗稍高,但每年还不到20欧元。 即使包括我需要的额外部件(PSU,infiniband,case),i7的方式仍然比至强便宜700欧元/ cpu。

那么,在HPC群集中使用“玩家”硬件是否可行呢? 或者我应该用xeon来做呢?

(这不是一个关键的应用程序,我可以处理停机时间,我想我不需要ECC?)

我们在高频金融交易领域做了一段时间(与HPC接近,因为我正在使用的应用程序架构)…

大约在2010年初,我正在部署定制的3U机架式,带有10GbE Solarflare (带有OpenOnload UDP消息内核旁路)和/或Infiniband互连的单插槽i7“游戏系统”。

我没有IPMI /带外pipe理,没有电源pipe理,单电源和没有热插拔部分。 我们在不同的点使用了SSD和内部SAS磁盘,但是磁盘对计算节点并不重要。 操作系统是Fedora Linux,具有高度定制和调整的内核。

这在概念validation中起作用,并且直到我们感觉到我们的交易应用程序如何在生产中与实时数据作出反应之后才被搁置。 然而,随着事态的发展,这变成了pipe理的噩梦。

诸如散热,数据中心散热/空间/密度(这些东西都是3U盒子),支持和远程pipe理等问题最终导致了这种努力的失败。 虽然CPU在技术上从来没有失败过,但其他所有组件都会发生问题! 。 而这只是一个8小时的日常生产使用周期…

我们做了什么长期的?

我们放弃了玩家的PC,并使用适当的专用服务器硬件。 是的,这是一家金融公司,所以我们没有预算限制,但考虑到未经证实的应用程序的潜在规模,我仍然需要意识到定价。 在所有价格范围内都有很好的服务器,如果您打算扩大规模,可以与制造商达成交易。 你不认为大的HPC研究实验室集群支付零售价格,你呢? 我们也没有…

所以,如果你想要这样做,请考虑一下大局。 如果你只是考虑在其他服务器级的硬件中使用台式机的CPU,它可以工作…但我不会推荐它的全职使用。

如果你知道CPU限制和可用性问题,那么我只能提供一个数据点供考虑。

i7不能使用ECC缓冲RAM,不能安装在双或四插槽configuration中。 这似乎是足够的理由不使用它 – 但当然,您的需求可能会另有规定。

就我个人而言,我仍然会倾向于至强,因为它旨在支持更长时间的并发负载。 如果你长时间运行CPU密集型工作,比如说几个小时或者几个星期,Xeon比i7的平均故障时间要长得多。

除此之外,我推迟@ MDMarra对服务器负载的回应。

这是一个密集的,高度并行的应用程序。

这听起来像是每核心CPU的功耗不像核心数量和内存的数量,你可以填入一个盒子,以扩大更快。 考虑到这一点,也许你想看看在双CPUconfiguration中使用16核Opteron 。 这可能不会DDR3-2400,但你可以填充256GB的DDR3-1600分布在这些32个CPU核心。