我注意到当我正在做一个dmesg时,我在日志中有EDAC错误信息。 然后我发现每次启动时都会收到相同的EDAC错误信息。 这是在CentOS 6.4 x86_64上。 我怀疑是内存问题,所以我从CentOS 6.0的Live DVD上运行memtest86,并没有显示任何问题。 我试图在时间删除一个内存棒,开机,仍然有EDAC错误信息。 想知道是从CentOS 6.0 Live DVD启动的最新的内核问题,在日志中查看,那里也有一个EDAC消息,就像CentOS 6.4一样。
这是错误信息:
Jul 5 00:44:19 mybox kernel: dracut: Switching root Jul 5 00:44:19 mybox kernel: readahead: starting Jul 5 00:44:19 mybox kernel: udev: starting version 147 Jul 5 00:44:19 mybox kernel: EDAC MC: Ver: 2.1.0 Jun 12 2013 Jul 5 00:44:19 mybox kernel: EDAC MC0: Giving out device to 'i3000_edac' 'i3000': DEV 0000:00:00.0 Jul 5 00:44:19 mybox kernel: EDAC PCI0: Giving out device to module 'i3000_edac' controller 'EDAC PCI controller': DEV '0000:00:00.0' (POLLED) Jul 5 00:44:19 mybox kernel: tg3.c:v3.124 (March 21, 2012)
我没有遇到任何其他系统问题。 它运行在具有4 GB RAM的Dell PowerEdge SC430上。 它有两个内部80 GB硬盘运行软件RAID,外部eSATA硬盘也运行软件RAID。
如果这是一个硬件问题,它只会涉及到内存? 难道是别的吗? 我愿意尝试更多的东西来达到这个目的,但是我不确定下一步是什么。 谢谢!
EDAC MC0: CE page 0x1521e, offset 0xb00, grain 128, syndrome 0x49, row 0, channel 1, label "": i3000 CE EDAC MC0: CE page 0x1521e, offset 0xb00, grain 128, syndrome 0x49, row 0, channel 1, label "": i3000 CE EDAC MC0: CE page 0x1521e, offset 0xb00, grain 128, syndrome 0x49, row 0, channel 1, label "": i3000 CE EDAC MC0: CE page 0x1521e, offset 0xb00, grain 128, syndrome 0x49, row 0, channel 1, label "": i3000 CE EDAC MC0: CE page 0x1521e, offset 0xb00, grain 128, syndrome 0x49, row 0, channel 1, label "": i3000 CE EDAC MC0: CE page 0x1521e, offset 0xb00, grain 128, syndrome 0x49, row 0, channel 1, label "": i3000 CE EDAC MC0: CE page 0x1521e, offset 0xb00, grain 128, syndrome 0x49, row 0, channel 1, label "": i3000 CE EDAC MC0: CE page 0x1521e, offset 0xb00, grain 128, syndrome 0x49, row 0, channel 1, label "": i3000 CE EDAC MC0: CE page 0x1521e, offset 0xb00, grain 128, syndrome 0x49, row 0, channel 1, label "": i3000 CE EDAC MC0: CE page 0x1521e, offset 0xb00, grain 128, syndrome 0x49, row 0, channel 1, label "": i3000 CE EDAC MC0: CE page 0x1521e, offset 0xb00, grain 128, syndrome 0x49, row 0, channel 1, label "": i3000 CE
所显示的涉及“给出设备”的行表示驱动程序已经初始化并正在与硬件通话。 一个是指存储器控制器(MC0),另一个是指PCI控制器(PCI0)。
CE开始的行表示可纠正的错误 ,即ECC硬件成功纠正错误。 如果你每隔几个月只看一次,没什么大不了的; 宇宙射线或其他。 如果你看到很多这些,那么是时候更换受影响的RAM了,因为它可能很快就会死掉。