以太网适配器绑定Ubuntu 10.04的问题

我有几台机器正在使用我正在构build群集。 为了提高性能,我们select在以太网接口上使用绑定(每个链路都是1Gig)。 我已经安装了Ubuntu 10.04的ifenslave-2.6模块,我也configuration了接口。 以下是我的configuration。

# The loopback network interface auto lo iface lo inet loopback # The primary network interface auto eth0 iface eth0 inet manual bond-master bond0 auto eth1 iface eth1 inet manual bond-master bond0 auto bond0 iface bond0 inet static address xxxx gateway xxx1 netmask 255.255.255.0 bond-mode 6 bond-miimon 100 bond-slaves none 

还尝试了bond-slaves eth0 eth1而不是bond-master bond0。 但什么都没做。

所以,正如您所看到的,我在balance-alb模式或模式6下运行bond,以便为上游和下游启用绑定。 经常(约四天的频率),我们看到机器不能互相交谈。 没有ping。 在nmap(nmap -sP xxxx)上不可见。 有时候有些机器是可见的,有些则不是。 他们都是克隆人,但这种行为很奇怪。 我首先检查了arp -a,看看我在那里是否有麻烦。 还有很多不完整的条目。 (通常发生在nmap扫描后),但即使超时发生和表安顿,我有麻烦ping他们。

他们都在同一个子网上。 没有防火墙。 全部去同一个交换机。 我的交换机configuration很简单,如下所示

  interface GigabitEthernet1/1 ! interface GigabitEthernet1/2 ! interface GigabitEthernet1/3 switchport mode access spanning-tree portfast ! interface GigabitEthernet1/4 switchport mode access spanning-tree portfast ! interface GigabitEthernet1/5 switchport mode access spanning-tree portfast . . . ! interface GigabitEthernet1/17 switchport mode access spanning-tree portfast ! interface GigabitEthernet1/18 switchport mode access spanning-tree portfast 

所有这些都在VLAN 1上。端口1进入我们的路由器。 端口3 – 18的configuration都是一样的。 他们的模式设置为访问和生成树设置为portfast。 每台机器在该交换机上占用两个链路。 交换机是思科4948.我可以很好地与我们的网关机器或我们网关外的机器交谈。 但让他们在内部进行交stream正成为一个问题,因为我们计划运行Hadoop。 任何帮助,推动,意见将真的有帮助! 谢谢。

另外,添加ifenslave-2.6 -a输出。

  ifenslave.c:v1.1.0 (December 1, 2003) o Donald Becker ([email protected]). o Detach support added on 2000/10/02 by Willy Tarreau (willy at meta-x.org). o 2.4 kernel support added on 2001/02/16 by Chad N. Tindel (ctindel at ieee dot org). The result of SIOCGIFFLAGS on lo is 49. The result of SIOCGIFADDR is 00.00.7f.00. The result of SIOCGIFHWADDR is type 772 00:00:00:00:00:00. The result of SIOCGIFFLAGS on bond0 is 1443. The result of SIOCGIFADDR is 00.00.ffffff80.0a. The result of SIOCGIFHWADDR is type 1 00:1b:21:47:a0:c1. 

即使这个罚款可以让我知道吗? 那么问题可能就在别的地方。

我们在整个networking中使用LACP /802.3ad作为我们的绑定连接。 从我们的SAN(4xGigE + 2xGigE)服务器(2xGigE)链接到我们的交换机间链路(2x和4xGigE的混合)。

同时获得带宽聚合和冗余的好处 – 对我来说是主要的好处 – 这是一个比静态链路聚合更容易pipe理的video。

虽然我知道它并不直接回答你的问题,但是你可能会发现它使得链接聚合变得更容易pipe理(甚至在第一时间工作!)。

我唯一的另一个build议:钩线跳起来,看看线路上发生了什么。