我在Supermicro X8SIE-F主板上运行Xeon X3450。 目前有4个注册。 安装了ECC DIMM(每个4GB大小;根据主板手册2-11页,安装为DIMM A通道1,DIMM A通道2,DIMM B通道1,DIMM B通道2)。
最近,这个错误被logging下来(除此之外):
EDAC i7core: New Corrected error(s): dimm0: +0, dimm1: +0, dimm2 +3
所以我假设检测到3个可纠正的错误。 但是,哪个DIMM受到影响?
如果我运行:
find /sys/devices/system/edac/mc/mc0 -type f -name "*count" -exec cat {} \;
所有的计数器显示为0。
但
cat /sys/devices/system/edac/mc/mc0/all_channel_counts/udimm2
显示3个错误。
列出了两个csrow:csrow0,csrow1
csrow0标签:
./ch0_dimm_label CPU#0Channel#0_DIMM#0 ./ch1_dimm_label CPU#0Channel#1_DIMM#0
csrow1标签:
./ch0_dimm_label CPU#0Channel#0_DIMM#1 ./ch1_dimm_label CPU#0Channel#1_DIMM#1
我读
https://www.kernel.org/doc/html/v4.10/admin-guide/ras.html
但不知道哪个dimm对应于all_channel_counts / udimm2。
任何帮助是极大的赞赏。
保罗