Broadcom组队连接失败,如果一个NIC断开连接,为什么?

我有一组服务器都运行BCM5716C NetXtreme II卡或BCM5709C NetXtreme II卡。 所有服务器都有自己的卡由BACS3软件组成:

  • 智能负载平衡和故障转移
  • 没有备用成员
  • 没有活的链接
  • 没有VLAN

所有的服务器然后连接到一对戴尔6224交换机。 我一直在观察的问题是,如果其中一个开关closures(或开启,但卡在一个诊断循环中),那么服务器将失去所有连接。 我的印象是,在上面的configuration下,他们只会降低他们的速度,并继续使用剩下的开关,直到问题恢复为止。

为什么所有的连接都停止,我该如何解决? 所有服务器都是Windows 2008 R2 Standard或Datacenter。 有些用于Hyper-V群集。

只是我在R730服务器上尝试了SLB和LACP与BACS4的网卡绑定方法。

首先让我分享SLB选项:

在netxtreme文件本身build议它适用于小型企业服务器,所以不build议数据中心服务器。

而且这种方法对于难以pipe理的networking交换机来说意味着更多。

在内部,GARP并不是DC架构的全部,但是应用程序数据库不能在DCdevise中驻留相同的广播。

现在它关于LACP:它看起来很好没有后备。 添加Teaming与TCP / IP堆栈绑定的第一个NIC的MAC地址,在故障转移期间,它丢弃所有在另一个NIC上的所有传入帧,假设它必须接受。 所以后备不会发生。

所以我们调用了DELL的支持,我非常努力地让工程师理解了这些概念,最后他问了一个LAB进行testing,并没有让他意识到我们正在为生产networking购买服务器。 所以LACP不会发生故障。 需要configuration像难以pipe理的时代。 比起那个时代,bcaz才刚刚起步。

最后要说的是,这一切都不符合networking标准。

感谢所有arul