我有3个IBM X3650负载平衡(循环)与红帽企业4.8。 其中之一有间歇性的内核恐慌,并报告2个特定的内存银行(3和5)是空的错误。 我只有银行1,4,7和10内存模块。我试图取代我所有的内存模块无济于事。
如果它们是相同的机器,并且可以承受停机时间,请考虑closures“坏”服务器和工作服务器,交换磁盘,重新启动磁盘,并查看问题是否随磁盘移动或与硬件保持一致。 如果前者出现磁盘/操作系统问题,如果后者出现硬件问题。
内核恐慌通常表示硬件问题。
银行3和银行5是空的:你是否尝试清理(使用压缩空气(为了不损坏卡)(高位))内存插槽区域?
如果3台机器具有相同的内核版本,configuration和软件,则听起来可能是主板问题:3个主板上的固件版本是否相同?
本周我们刚刚有一个类似的问题,一个X3650(M / T:7979)
我们运行BIOS v。1.03(随系统提供)。 支持build议升级BIOS – 我们有两个系统在类似的负载平衡设置,但configuration漂移。 一台服务器的BIOS版本为1.15,另一台服务器运行的是旧版本的BIOS。 旧版本的BIOS系统是有问题的。
BIOS更新日志引用了几个与内存有关的问题。 我build议使用updateXpress或Bootable Media Creator升级BIOS。 如果这不起作用,请拨打1800IBMSERV。
您可以通过安装IBM DSA(可从中心修复 )实用程序并以root身份运行来检查您的BIOS版本,
./opt/IBM/DSA/bin/biosversion
是的,来自不存在的DIMM的错误看起来像是主板故障。 但是先尝试BIOS更新可能会更容易一些。 AFAIK x3650 BIOS允许降低内存速度,这也值得尝试。