ProLiant DL580 G7 E7升级问题

我是一名ITpipe理员,并且多年来一直在维修台式电脑和服务器。

我们有一个DL580 G7的保修期已过期12/31/2015。 最初提供至强E7530和标准内存盒,我们最近升级到E7-4870和E7内存盒。 从那以后,我们遇到了很大的麻烦,以确保它的工作。 为了find问题,我进行了一个顺序testing:

1)PROC1 = A,PROC2 = B,PROC3 = X,PROC4 = X,POST = TRUE
2)PROC1 = C,PROC2 = D,PROC3 = X,PROC4 = X,POST = TRUE
3)PROC1 = A,PROC2 = X,PROC3 = B,PROC4 = X,POST = FALSE
4)PROC1 = A,PROC2 = X,PROC3 = X,PROC4 = B,POST = TRUE
5)PROC1 = A,PROC2 = C,PROC3 = X,PROC4 = B,POST = TRUE
6)PROC1 = A,PROC2 = C,PROC3 = D,PROC4 = B,POST = FALSE
7)PROC1 = E,PROC2 = F,PROC3 = X,PROC4 = X,POST = TRUE
8)PROC1 = E,PROC2 = X,PROC3 = F,PROC4 = X,POST = TRUE
9)PROC1 = E,PROC2 = G,PROC3 = F,PROC4 = H,POST = TRUE

A,B,C,D是E7-4870(SLC3T)130W TDP
E,F,G,H是E7530(SLBRJ)105W TDP
X是空的套接字

TRUE =服务器发布并运行OS(WS2012 R2数据中心)
FALSE =发布前的服务器挂起(在ilo3上显示最后一个邮政编码4048,然后邮政编码消失,没有video,相同的结果连接到VGA端口)

服务器部分:
DL580 G7(584087-421)
主板(512843-001 / 591196-001)
CPU板(583367-001 / 591197-001)
I / O板(512844-001 / 591199-001)
E7 ram cartridge(650761-001 / 647058-001)
标准ram cartridge(617524-001 / 591198-001)
美光4GB RAM DIMM(500203-061)
4xPSU 1200W(438203-001 / 498152-001)

系统ROM P65 10/01/2013(重置为默认值)
iLO固件版本1.85

根据此特定ProLiant服务器的Hp QuickSpecs,仅在DL580 G7 CTO(643086-B2x)和预configuration型号(6430xx-xx1 / 6967xx-xx1)中支持E7-4800系列。 据我所知,与入门级的主要区别是E7墨盒。 主板,CPU板和I / O板是相同的部件号。

要恢复,似乎服务器不会发布套接字PROC3挂载E7-4870(testing所有四个4870,相同的结果)。 我怀疑这个sockets上的电气/电源问题,因为TDP比E7530更高。

我打算先更换CPU板,欢迎任何意见。

你们有没有遇到过这样的问题?

我们刚刚将三款型号为584084-001的DL580 G7升级至Xeon E7-4870处理器。 我们发现在我们的环境中重要的是主系统板(而不是CPU板/托盘或SPI提升板)的修订。 在阅读最后一个回复之后,我检查了iLO以validation我们所有的PAL版本。 我们有一台运行4个E7-4870处理器的服务器,在PAL版本为0x10的CPU板上有1TB的内存。

我们发现,只要系统的MainIO板(hp part 512843-001)是版本0B或更高版本,它就可以工作。 三个服务器中的两个具有MainIO板的版本0A,他们不会在新的处理器上发布。 在这些系统上,我们所取代的只是主板,结果是一个可用的服务器。

一切只是在新的MainIO电路板版本的服务器上工作,所以我们最初尝试将其CPU /内存托盘移动到不工作的服务器。 当他们仍然无法工作时,我们认定问题出在CPU /内存托盘之外。 在MainIO板上的修改是非工作服务器和工作服务器之间的唯一区别。

我们从我们通常的供应商那里订购了主板,但没有办法指定版本。 我们只是订购,然后在安装前validation版本。

编辑:添加我们的工作CPLD / PAL版本的诊断信息:

Server 1: - CPLD PAL0: ProLiant DL580 G7 SPI Board PAL version 0x0F - CPLD PAL1: ProLiant DL580 G7 MainIO Board PAL version 0x0F - CPLD PAL2: ProLiant DL580 G7 CPU Board PAL version 0x0E Server 2: - CPLD PAL0: ProLiant DL580 G7 SPI Board PAL version 0x0F - CPLD PAL1: ProLiant DL580 G7 MainIO Board PAL version 0x0F - CPLD PAL2: ProLiant DL580 G7 CPU Board PAL version 0x0F Server 3: - CPLD PAL0: ProLiant DL580 G7 SPI Board PAL version 0x10 - CPLD PAL1: ProLiant DL580 G7 MainIO Board PAL version 0x11 bootleg 0x10 - CPLD PAL2: ProLiant DL580 G7 CPU Board PAL version 0x10 

这是“致电惠普支持”的情况。

就这些。

无论您的保修状态如何,您都在努力完成需要专业知识的工作。 我假设你已经升级了所有的固件,但是看起来你已经认识到了,但是却忽略了一个严重的兼容性问题。

像ewwhite通知它,我只是忽略了一个严重的兼容性问题。

我最终得到了一个643086-B21 CTO模型,在PROC1&PROC2上安装了两个E7-8837。

(I,J为E7-8837,SLC3N,130W TDP):

1)PROC1 = I,PROC2 = J,PROC3 = X,PROC4 = X,POST = TRUE(E7暗盒)
2)PROC1 = A,PROC2 = B,PROC3 = C,PROC4 = D,POST = TRUE(E7暗盒)
3)PROC1 = E,PROC2 = F,PROC3 = G,PROC4 = H,POST = TRUE(标准暗盒)

系统ROM是P65 10/01/2013

正如你所看到的,一切工作正常(4xE7-4870和4xE7530 cpus)。

CTO服务器部分:
主板(512843-001 / 591196-001)
CPU板(583367-001 / 591197-001)
I / O板(512844-001 / 591199-001)

与584057-421相比,硬件,p / n板完全一样。

那么区别在哪里呢?

在这种服务器中,每块主板(SPI,MainIO,CPU)都有自己的芯片ROM(Lattice EEPROM / Flash),名为复杂可编程逻辑器件CPLD和可编程arrays逻辑PAL。 这可以解释为什么一些HP ProLiant服务器需要很长时间才能启动。

您可以在信息/诊断/ iLO自检结果下的iLO3菜单中看到编号版本:

对于DL580 G7 CTO p / n 643086-B21:

CPLD – PAL0 = ProLiant DL580 G7 SPI板PAL版本0x10(p / n 591199-001,格型贴片= SPI PAL,512844v4,6470)
CPLD – PAL1 = ProLiant DL580 G7 MainIO板PAL版本0x11 bootleg 0x10(p / n 591196-001,晶片贴纸= Sys PAL,20110215,5290)
CPLD – PAL2 = ProLiant DL580 G7 CPU板的PAL版本0x10(p / n 591197-001,晶片贴片= CPLD,0x1010,EB96)

在这里输入图像说明

对于DL580 G7 p / n 584087-421:

CPLD – PAL0 = ProLiant DL580 G7 SPI板PAL版本0x0F(p / n 591199-001,晶片贴片= SPI PAL,R18,3484)
CPLD – PAL1 = ProLiant DL580 G7 MainIO主板PAL版本0x0E(p / n 591196-001,晶片贴纸= Sys PAL,R18,6D87)
CPLD – PAL2 = ProLiant DL580 G7 CPU板,版本为0x0E(p / n 591197-001,晶片贴片= CPLD,R18,B5B6)

在这里输入图像说明

对于两台DL580 G7(在两台服务器上启动,不需要更新CPLD):

CPLD – PAL3 = ProLiant DL580 G7 Combo PCIe和PCI-X板卡版本0x06(部件号591204-001,晶片贴片= CPLD,R18,80B6)
CPLD – PAL3 = ProLiant DL580 G7标准PCIe板卡版本0x06(部件号591205-001,晶片贴片= CPLD,R18,80B6)

注:带有CPU板PAL v0x10的4xE7-4870无法在DL580 G7 p / n 584087-421上引导。 因此,更换/更新CPU板是不够的,你也必须更换/更新MainIO / SPI板(不分开testing)。

如前所述,DL580 G7 CTO支持E7500处理器,因此更新标准服务器上的CPLD固件不会导致兼容性问题。 所以如果你打算用E7处理器升级你的标准DL580 G7服务器,你必须更新你的CPLD芯片。 不幸的是,我还没有发现DL580 G7服务器的任何CPLD固件更新。 似乎惠普不提供下载,我怀疑他们会。 但是,您可以为其他许多ProLiant服务器find它:
例如,hp文档(部件号AM426-9011 B)描述了DL980 G7服务器上的E7系列处理器升级(第6页,使用FPGA智能组件刷新FPGA)。 您可以在hp ftp服务器上获得完整的iso CPLD更新固件(/pub/softlib2/software1/pubsw-linux/p2139015018/v70029/dl980g7-offline-cpld-fpga-fmp-flash-1.0-8.zip)
而且,对于那些可能感兴趣的人,我还发现了DL585 G7的CPLD更新(/pub/softlib2/software1/sc-linux-fw/p2039955643/v85801/cp019851.scexe)

如前所述,E7-4800系列仅支持DL580 G7 CTO(643086-B2x)和预configuration型号(6430xx-xx1 / 6967xx-xx1)。 但是,如果你的主板出现故障,特别是第二个市场,你必须用正确的部件号代替它,并注意获得正确的兼容CPLD芯片版本!

另外,对于那些仍然希望升级标准DL580 G7和没有CPLD更新的E7 Westmere处理器的用户,请记住:
– 只有在PROC1和PROC2套接字(为了获得一个对称的configuration),所以最大内存量被分成两部分,
– 2xE7-4870的configuration速度比4xE7530的configuration速度快,耗电量更低(在WS2012 R2空闲模式下,2xE7-4870,20芯= 208W,4xE7530,24芯= 337W),
– 扩充板不能添加,因为您必须填充PROC3。

问题解决了。

编辑:作为对@Clint的回应,详细的MainIO主板版本:

584087-421 在这里输入图像说明

643086-B21 在这里输入图像说明