SAN的群集共享卷文件副本的性能

我希望有人能帮助我一个奇怪的问题。

我们运行带有Server 2008 R2和Equallogic PS4000 SAN的Microsoft故障转移群集。 我们的主要configuration在集群中有2个Dell Poweredge T710服务器。 我们有CSV和Quorm设置。 每台服务器有10个Broadcom 1Gb网卡。 目前,NICS中有4个用于访问SAN的iSCSInetworking。 他们使用MPIO和戴尔HIT包。

我们有5个虚拟机在每个节点上运行,一切运行平稳。 没有明显的性能问题或任何事情。 在SAN中,我可以看到从每台服务器到每个卷的4个iSCSI连接(CSV和Quorm)。 再次,这似乎performance很好。

我遇到的问题是备份。 我已经尝试了一些备份程序,如backupchain和Veeam。 问题是他们都备份虚拟机非常慢。 例如,我有一个在集群上运行的500GB(固定磁盘)VHD。 这需要超过18个小时来备份VHD,而压缩和解除closures应该是禁食。

我们还有一个独立的服务器,用于备份。 它有很多定向附加存储。 作为故障排除的一部分,我决定将该服务器作为节点引入群集。 它现在可以访问CSV并可以从C:\ clusterstorage \ volume1中读取,这是我们的VHD所在的地方。 该备份服务器只有2个网卡。 1个NIC正在连接到iSCSInetworking,另一个正好在主networking上。 它内置英特尔NICS,没有任何MPIO或团队。

所以现在在集群中的第三台服务器,我开始做一些基准testing。 我有一个存储在CSV中的大约7GB的testingVHD。 我已经testing了从所有3个服务器将VHD复制到相应服务器的定向附加存储的文件。 作为群集中主要节点的2个戴尔服务器(它们容纳虚拟机)正以约20Mbs /秒的速度读取该文件。 以这种速度减慢备份速度。 另一台只有1个NIC的服务器读取速度约为100Mbs / Sec。

我今天和戴尔通了几个小时的电话。 我们经历了各种各样的考验,他很愚蠢。 他真的不知道为什么只有1个NIC的服务器读取的速度是使用4个NICS和MPIO的服务器的5倍。

我们在文件复制过程中查看了NIC的networking利用率。 具有4个NIC的服务器在文件复制期间的活动略有增加,但是在所有4个NIC上它们仅增加了约8-10%。 在文件复制过程中,具有1个NIC的另一台服务器跳到了80%以上。

我打算在下class后进行更多的testing,并且明天再打电话给戴尔,但是我真的很困惑(戴尔的支持代表),为什么我无法在这些服务器上获得更快的文件复制访问权限。

任何人对此有任何意见? 任何反馈将不胜感激。

提前致谢。

根据您提供的信息,似乎您的备份过程将CSV设置为redirect访问模式。 这可能是因为您的备份软件不支持CSV,并尝试通过不拥有资源的服务器访问VHD文件。

您应该能够通过在“存储”下的“故障转移群集pipe理器”中查看CSV来validation此情况。

如果是这种情况,我会联系Veeam,看他们如何推荐执行群集的Hyper-V备份。

有关redirect访问的更多信息,请访问: http : //blogs.technet.com/b/askcore/archive/2010/12/16/troubleshooting-redirected-access-on-a-cluster-shared-volume-csv.aspx

这听起来像一个错误configuration的MPIO设置给我。 无需在您的网站上花费数小时来查明确切的问题是不可能的,但这里有几点要注意:

  • 如何configurationEquallogic来呈现LUN(s)? 它正在做主动/被动或主动/主动? 它使用ALUA吗? 如果它不是ALUA,那么你可能会遇到path垃圾,这将在重I / O期间将SAN弯曲到膝盖处。
  • 你使用巨型框架? 如果是(或者如果您不知道) – 检查所有设备上的SAN,交换机和网卡以确保MTU设置在任何地方都是相同的

每个受尊敬的SAN供应商都为不同的使用场景提供最佳实践。 您应该能够在Windows上使用iSCSIfind一个MPIO。