在生产环境中添加第二个FC交换机到fabric的最佳实践?

我现在有一台Brocade Silkworm 200e交换机。 公司交换服务器和3个ESX 3.5主机通过它连接到clariion cx3arrays。 端口0,1是SPA0和1,端口4,5是SPB0和1。

我的计划是在200(它已经架设并通电)旁边添加一台Brocade Silkworm 300交换机,进入数据中心并将SPA1和SPB0拉出200,并将它们插入300交换机的端口。

我有点偏执于拔出正在生产的FCpath。 我有一个合乎逻辑的假设,事情将会故障转移到SPA0和SPB1,A1和B0不会错过。 不过,如果可能的话,我希望100%的理解我能做些什么来进一步降低风险。

如果一个LUN当前由SPA拥有,它是否会自动利用循环中的SPA0和SPA1,或者交换机是否独享特定的path,除非失败呢? 示例 – 是使用SPA0或SPA1的交换服务器,还是使用0和1主动/主动?

我猜测,如果它正在使用两个path到一个SP主动/主动扰乱其中一个风险较小,因为我确信它正在使用其他path已经没有麻烦。 我害怕强制故障转移到以前没有使用过的替代path,然后发现电缆是不可靠的。

我应该彻底颠覆公司,并closures所有虚拟机和交换服务器,以确保在发生错误的故障切换时不会发生数据损坏? 或者这是过度的? 无论哪种方式,我将在完整备份周期后立即执行操作。

如何监控故障转移? 锦缎200e是否会详细logging它? 我想最大限度的保证,当我拔出这些插头时,一切仍然正常。 我可以在esx主机上重新扫描存储,并观看交换机的电源path监视器。 还有什么我可以做的更好?

我宁愿比情况更为谨慎,而不是过于自信地假设当我们所有的鸡蛋都在这个篮子里时,第一次做这样的事情。

我希望你的计划是build立第二个独立的结构,这通常被认为是一个好主意。

你不说你的服务器是否有多个HBA。 我希望如此,因为它可以让你正确地重新configuration多余的结构,但如果没有,它不会显着影响你的即时计划。

Powerpath将处理Exchange服务器的故障转移,并应在A0断开连接时通过A1select一个path,而不是B0或B1,除非两个SPA端口都失败。 如果任何path不能运行,它会告诉你,或者至less你不会看到你期望的path。 根据Powerpath的版本(即SE版本或完全许可版本),您可能有负载平衡的多path策略处于活动状态,但在任何情况下,path故障转移对于您所描述的设置都应该是可靠的。 如果您碰巧断开了活动path,Powerpath将通过备用path重新路由失败的IO,只要它们健康。 您可以在Powerpath GUI中检查path状态,或者从命令行使用powermt check来检查失败的\ newpath,或者powermt restore检查并删除\ add dead \ newpath。 如果path策略已经设置为负载平衡,并且有通过SPA0和SPA1可见的健康path(例如),那么您将拥有相当高的信心,即一切正常。

在ESX服务器上,您应该能够从VI Client-> Configuration-> Storage选项卡中检查每个LUN的可用path。 在属性中,您可以看到可用的path,这些path处于活动状态,处于待机状态,在“pipe理path”对话框中,您可以更改策略(固定\ MRU \循环法)。 您不需要更改任何内容,但是又需要确保您希望使用的故障切换path可用。 再次,ESX的多path堆栈将处理故障转移,如果IO在活动path上正在运行,它将在另一个path上重新发送它们,如果它检测到它失败。 ESX 3.5仅支持轮循多path实验,所以在这种情况下你不想搞乱它。 您可以临时设置一个固定path策略,并强制LUN到达您想要的path,如果您希望主动,但CX3的标准设置是将其留在MRU,那应该没问题。

在这两种情况下,在故障转移发生之前可能会有一些滞后,并且IO可能暂时停顿,但是如果冗余path实际上是健康的,则不会有任何故障。