/ var / log /消息显示很多CE Err = 0x2000即使在未使用的银行(插槽)

我最近不得不升级旧服务器(HP ML350G5)与使用FBDIMM DDR2内存(不能得到我住的新的)。 重启后/ var / log / messages一直困扰着CE Err = 0x2000的错误,但系统似乎是稳定的。 我猜ECC正在处理事情。

没有意义的是即使我只使用2个插槽(插槽0和3),错误日志也会在所有存储体上显示相同的错误。

安装的RAM是兼容Centos 5.5 32位的2x4GB Kingstone模块。 我正在等待一些可用的停机时间来安装PAE内核来利用8GB的优势,但我没有预料到的错误。

其他postbuild议运行一个memtest,但我想分享,看看是否有人经历类似的错误指向未使用的内存插槽。 错误是否与32位可以考虑的内存(没有运行64位或PAE内核)相关?

错误日志示例如下。

8月14日21:00:35 umm内核:EDAC MC0:CE行0,通道0,标号“”:(分支= 0 DRAM-Bank = 4 RDWR =读RAS = 12405 CAS = 506,CE错误= 0x2000 -Mirrored Demand Data ECC))

8月14日21:00:36 umm内核:EDAC MC0:CE行0,通道0,标号“”:(分支= 0 DRAM-Bank = 2 RDWR =读RAS = 3505 CAS = 4,CE错误= 0x2000 -Mirrored Demand Data ECC))

8月14日21:00:37 umm内核:EDAC MC0:CE行0,通道0,标签“”:(Branch = 0 DRAM-Bank = 6 RDWR =读取RAS = 12404 CAS = 504,CE Err = 0x2000 -Mirrored Demand Data ECC))

…所有DRAM-Bank =值都出现在日志中(从0到7)

如果你还没有安装PAE内核,那么你目前正在运行什么内核?

memtest可能无法识别由于内存为ECC内存而导致的错误

请尝试运行edac-util -v如果有任何不可纠正的问题,您将能够识别错误的内存行。

根据日志,您正在系统中获取CE(更正的错误)消息。 你可以忽略它们,编辑grub.conf并将mce = dont_log_ce添加到内核行,这将停止纠正的错误消息来login文件。

但是在系统中运行内存检查总是很好的。