安装在线备用内存有意义吗?

我使用的是HP DL360p第八代。我需要一个非常可靠的服务器,所以我使用的是带有备用驱动器的RAID 1,并且还增加了额外的电源。 但是,我应该安装在线备用内存吗? 还是只是在浪费金钱?

这不值得。 使用ECC RAM和正在运行的HPpipe理代理,检测不良内存非常容易。 在看到影响操作的主要问题之前,通常需要几个步骤进行干预。 在标准支持下,内存更换是下一个工作日,所以不需要通过添加备用DIMM来使内存configuration复杂化。

我在系统上遇到的最糟糕的HP ProLiant内存问题最终在一个星期内发生几次ECC警报之后崩溃了服务器。 错误来了,服务器通过一个ASR重新启动,并且机器恢复了坏的DIMM被禁用。 这是一个HP ProLiant DL580 G4系统,错误日志如下…

0004 Repaired 22:21 12/01/2008 22:21 12/01/2008 0001 LOG: Corrected Memory Error threshold exceeded (Slot 1, Memory Module 1) 0005 Repaired 20:41 12/06/2008 20:43 12/06/2008 0002 LOG: POST Error: 201-Memory Error Single-bit error occured during memory initialization, Board 1, DIMM 1. Bank containing DIMM(s) has been disabled. 

当天,我安装了许多采用RAID5式内存arrays的HP ProLiant DL740服务器 。 因此,一个16GB的RAM服务器实际上有20GB安装在8个DIMM的热插拔组中。 对于我部署并运行5年以上的数十台服务器,我只有一个DIMM模块出现故障。 人物…

编辑:
您正计划在高频交易环境中使用此function。 您在这样的服务器上询问了有关备用RAM的延迟问题。 通常,对于低延迟应用程序,我禁用主机系统上的内存预失败检查。 这是惠普在其configuration惠普ProLiant服务器BIOS低延迟应用程序白皮书第7页的build议。 这是一个监测和风险的问题。 我很less有DIMM失败。 你更关心速度还是弹性? 你不会在硬件层面上

我认为这只是在浪费金钱。 内存已经有了ECC。 这就是说,如果你的服务器将被全天候使用,并且永远不会停机,那么这可能是有道理的。 如果你正在使用虚拟机pipe理程序,那么移走所有的虚拟机,closures系统,换掉坏的内存芯片是很简单的。

根据我的经验,高端服务器内存芯片偶尔会变坏,需要更换。

对于您来说,决定一个非常容易的事情 – 启用在线备用模式或locking步骤模式需要多less成本,然后考虑在服务器的整个生命周期内,基于内存的服务损失的影响会有多大。

在我们的服务器中,我们没有使用这两种方法,其中现有的故障转移群集中的服务器(Oracle RAC,vSphere等),但是在我们的服务器无法以任何实际/经济的方式进行群集的情况下使用。

只有您可以根据成本/收益来决定,但技术确实有效,我知道在过去的2.5年里,我们避免了在我们的一台服务器上发生两次完整的系统中断,对于我们来说投资是值得的,里程可能不一样。