镜像模式RAM:值得吗?

对于英特尔刀片服务器设置的“镜像通道模式”(您在裸机刀片上运行的典型中等重要的MySQL OLTP数据库;现在没有虚拟化),并不十分熟悉。

从英特尔文档中我可以find:

英特尔至强处理器5500系列和英特尔至强处理器5600系列支持通道镜像,以在镜像configuration中configurationDDR3 DIMM的可用通道。 镜像configuration是内存的冗余映像,尽pipe存在零星的不可纠正错误,仍可以继续运行。 通道镜像是一种RASfunction,其中保存了两个相同的内存数据映像,从而提供最大的冗余。

在英特尔至强处理器5500系列和基于英特尔至强处理器5600系列处理器的英特尔服务器主板上,镜像可通过各种渠道实现。 主动通道保存主图像,其他通道保存系统存储器的辅助图像。 英特尔®至强®处理器5500系列和英特尔®至强®处理器5600系列处理器中的集成内存控制器在两个通道之间交替进行读取事务。 在正常情况下写交易发送到两个通道。

但是,我并不是真的在这里拣选他们的东西。 我失去了一半的存储容量,但是我获得了内存的“冗余”,并且可能获得读/写性能好处? 像RAID 1的RAM? 任何人都有这个configuration的实际经验?

    就我个人而言,我会更早地使用某种forms的集群,而不是硬件弹性水平。 像磁盘这样的便宜的组件可以让它们翻倍,但是镜像内存是一个很好的但却不是很有用的东西。 我的意思是什么更可能失败; 一个CPU,你的操作系统,你的软件,你的主板,你的PSU / s。 我很快就把钱投入集群。

    “RAM 1的RAID”是一个准确的描述。 根据我的经验,没有太多的性能好处,但取决于巴士速度与模块的速度,您的里程可能会有所不同。

    就冗余度而言,一个模块不好经常是不经常的。

    就我个人而言,只要启用镜像就closures镜像。

    我已经读过这样的东西(你可以用CPU来做)在超级计算机集群中非常有用。

    这些集群中的一些正在运行那么多的机器,每隔几个小时就会出现一次机器故障。 比工作更快完成。 这真是弄乱了计算。 像这样向每个节点添加冗余可以使故障之间的时间增加一倍以上。

    这种内存模式是专为需要高可用性的情况而devise的。你不应该看到太多的性能差异(因为在正常的操作下,一个通道的丢失可能不明显),但是实际上会损失大量内存。 启用镜像后,只有三分之一的内存可用,因为两个DIMM插槽是主通道,两个DIMM插槽是备用通道,并且不使用两个DIMM插槽。 (至less这是如何在IBM上)

    我通常build议closures它(如果你有一个应用程序或操作系统,喜欢内存 – 让我们面对它:有没有?),或保存升级到IBM的ex5芯片组(惠普和其他人跟随类似的产品),增加了更多的QPI。

    偶尔有“这台服务器必须启动,而不pipe这个服务器的数量是多less”,这种冗余是有帮助的。 另外你已经购买了不到恒星质量的RAM,这可能会使你从蓝屏或2节省。

    “这值得么 ?”

    也许“它做什么,为什么我要这个”是一个更好的问题。

    首先,由CPU制造出具有该能力的CPU(因为不同于RAID或ECC存储器内部CPU硬件支持是必需的),但是在SPARC,POWER,x86等中的实际实施可以变化并在多年内得到改善;因此需要偶尔更新这个答案)。

    接下来,主板必须支持该function(在这种情况下,一个很好的方法是确保内存插槽的最大数量)。

    最后,一旦发现故障,操作系统必须“做正确的事情” – 这很重要。 如果你驾驶汽车或飞机飞行,你是否想看到一个蓝屏,并忙于重新启动您的计算机,而你是失控的,或者会警告更好?

    你需要一台计算机“上”,如果这台计算机的工作是操作的“大脑”,否则你需要坐在电话旁边工作,很快(不可能)。

    当它“死或死”,那么“你必须死,否则死”。

    以下是来自不同Mfg的一些不同的实现。 以及类似于“内存镜像”的技术。

    通过在ONE BOX中有两个(或多个)所有部分(在失败后仍能正常工作)可以以最低的延迟进行恢复; 那可能对你很重要,或者你可能想在别的地方花你的钱(并且在那个盒子中获得更大的内存容量)。

    当你的公司的座右铭是“目标= 100%正常运行时间”,那么这是一个难题,在两个(或更多)国家(等)有两个(或更多)这些盒子。 每一位(双关)帮助一位(认真:节省一点,保存一个字节)。

    大多数人不需要担心MM,就像大多数人不需要RAID,ECC或者甚至备份他们的数据一样:不要让他们托pipe公司的软件,除非你能承受停机时间。

    如果您的服务器已经实现了这个function,请确保您可以为此收取额外费用,或者使用该function自动pipe理您的服务器,否则您不需要它。

    以下是来自各种Mfg的示例实现:

    http://www.lenovo.com/images/pdf/server/tech_resources/ThinkServer_Memory_RAS.pdf

    http://www.fujitsu.com/global/products/computing/servers/unix/sparc-enterprise/technology/availability/memory.html

    http://h18000.www1.hp.com/products/servers/technology/memoryprotection.html