Win2K8服务器MPIO iSCSI故障切换不起作用

我希望通过两个单独的networking堆栈*在我的Windows 2K8服务器实验室系统和我的NetApp文件pipe理器之间传递iSCSIstream量*。

我的configuration如下:

  • 一台安装了iSCSI软件启动器的Win2K8服务器,安装了MPIO组件,以及两个networking接口:192.168.201.85/24和192.168.202.85/24
  • 一个具有发布到Windows服务器的IQN的LUN的NetApp文件pipe理器和两个接口:192.168.201.200/24和192.168.202.200/24
  • 两个独立的交换机,一个用于192.168.201.0/24,一个用于192.168.202.0/24。 两者都是平坦的(无VLAN),并没有连接到任何其他networking设备 – 包括对方。

我configuration了MPIO组件来注册iSCSI软件启动器“适配器”类。

然后,我进入了iSCSI启动器控制面板,并将两个文件pipe理器地址都添加为“目标”,并针对它们运行发现。 这显示了可用的单个LUN。

然后,我已经“login”到LUN两次,为每个连接select不同的“源”IP地址。 这两个连接都有“重新连接在启动”选中和“MPIO”检查。

在检查目标时,我看到两个与目标的连接,一个用于NetApp正在使用的每个IP地址。

当我检查我的持久连接时,我看到两个连接,一个用于NetApp正在使用的每个IP地址。

(我现在应该提到,我已经通过向每个IP演示单个连接来testing两个文件服务器IP,然后在该IP上安装并使用驱动器。)

然后我进入我的磁盘pipe理器,并在LUN上设置分区,并在线标记它。 磁盘按预期工作。

现在我进入新磁盘的属性,然后单击MPIO选项卡。 我可以看到这个磁盘使用了两个连接。 然而,我不知道如何将我在这个标签中看到的连接与我在iSCSI启动器屏幕上看到的连接相关联 – 所以虽然我认为在iSCSI启动器屏幕中每个连接都有一个连接,但我无法certificate。

在MPIO选项卡中,我有几个选项。

我已经将计时器全部减less到1秒,并启用了pathvalidation。 所以我对这些设置的理解意味着:

  • Windows服务器每秒钟将validationpath是否有效,即远程目标IP正在正确应答;
  • 在检测到故障后,服务器将仅重试一次,检测到故障后一秒钟;
  • 服务器将标记为无效,并在发生故障后一秒钟删除path。

关于冗余,我已经尝试了几件事情:

  • 如果我将两个连接设置为主动/主动,并select循环使用,则磁盘工作。 如果我在磁盘上设置复制操作并通过拉出其中一个networking电缆来模拟networking故障,则连接停止约30秒,然后继续。
  • 如果我将连接设置为故障转移(仅通过将一个连接标记为“待机/被动”并select“故障转移”),则连接仍然有效。 (有趣的是,磁盘到磁盘的拷贝似乎始终以循环的速度的两倍左右stream动,但无论如何。)如果我通过拔出备用电缆来模拟故障,连接停止约1秒钟,然后继续。 如果我通过拔出活动电缆来模拟故障,则连接将停止 – 而且我无法通过任何一根电线来ping通filter。 最终操作系统告诉我磁盘失败。 networking停留在这个状态几个小时(在这之后,我厌倦了等待它,并重新启动服务器)。

我做了一些研究,发现了一个Microsoft KB968287,讲述了由于Win2K8和Vista中的MPIO.sys驱动程序中的计数器错误而导致的故障转移未完成,但是安装此修补程序并没有改变任何我能看到的。

所有这些让我怀疑我错过了一些基本的东西。 我做错了吗?

这里真正的目标是提供一个更可靠的iSCSI传输,通过它在我的Hyper-V群集上运行虚拟机并安装Exchange存储。 我们知道如果检测到磁盘打嗝,特别是Exchange会很快卸载信息存储,所以我们希望即使一条path失败,MPIO也会允许数据stream动。


* =我们目前只有一个iSCSI交换机,但是当这个开关出现故障时,我们不得不取消整个世界,以便在一台交换机上刷新固件。 因此,我们需要两个完全隔离的networkingpath – 网卡,交换机和另一端的接口 – 这样我们就可以在任何给定的时间将其中一半的服务中断,进行维护而不会造成世界的死亡。

我的理解是,在Netapp中的7模式下,即使您通过两条path发送IO,每个LUN也将具有首选path。 你实际上做的是通过一个额外的跳跃发送每一个IO,而另一个控制器通过互连将其redirect到该LUN的主控制器。 您所观察到的30秒延迟可能是完成硬性集群节点接pipe所需的时间。

8模式几乎不仅仅是一个玩具(除非你觉得像Netapp的alphatesting,7模式是唯一的select),但是通过虚拟几层文件pipe理器(包括以太网接口)可以解决这个问题。

如果你想要一个真正活跃的活动框的iSCSI或任何其他块协议,你不想要一个Netapp。 收购时间并不能保证,过去我已经看到花了30秒多。