注意:更新如下所示
对于使用802.3ad NIC绑定的Linux服务器( Debian 6.0.6 ),我遇到了一个很奇怪的问题。 债券中的所有网卡有时会被标记为closures, events进程在单个线程上100%的CPU利用率下运行。 除了重新启动服务器之外,没有任何办法可以使绑定恢复; 那么一切都恢复正常。
正在使用的NIC是Intel VT Quad Port Server Adapter并且所有四个端口都已绑定。 802.3ad已经在交换机(Netgear智能交换机)上正确启用并正常运行。
在重新启动后,日志中没有任何内容出现,但是在发生崩溃/故障后检查terminal时,已经打印了无法重置NIC的错误消息。 我不记得确切的消息; 我期望他们在一个日志文件,所以我刚刚重新启动服务器备份。
这是如何configuration债券:
############################ # modprobe.d configuration # ############################ alias bond0 bonding options bond0 mode=4 miimon=100 arp_interval=100 arp_ip_target=10.1.1.1 max_bonds=2 # Another bonding rule for two other NICs... ############################ # relevent lines in # # /etc/network/interfaces # ############################ auto bond0 iface bond0 inet static address 10.1.1.100 netmask 255.255.254.0 broadcast 10.1.1.255 network 1.1.0.0 gateway 10.1.0.1 slaves eth2 eth3 eth4 eth5 bond-mode 802.3ad bond-miimon 100 bond-downdelay 200 bond-updelay 200 dns-nameservers 10.1.0.1
在上面的configuration中, 10.1.1.1 ( arp_ip_target )是交换机的IP地址,始终打开。
任何人之前看到这个或有任何build议? 过去两个月发生了两次, 确切地找出造成问题的原因是相当困难的,但是需要修正。 我已经尝试了所有我能想到的方法来重现问题。
更新:网卡上的一个接口开始只与交换机协商一个10mbit的速度。 我确认电缆不是问题,交换机也没有将带有1gbit NIC的笔记本电脑直接插入到遇到问题的服务器的接口上。 它首先谈判1000Gbit的速度,几秒钟后死亡,重新谈判100mbit的速度。 我也尝试将有问题的卡上的另一个接口插入到交换机的同一个端口,失败的接口被插入,并且完美地工作。
假设一秒钟内卡上只有这一个接口失败,而不是整个卡本身。 如果一个界面退出,整个债券为什么会失败呢? (我的configuration有问题吗?) 如果没有,我假设整个卡片慢慢地开始失败并且需要被replace。
无论哪种方式,我打算更换整个卡,我只是想确保我的configuration是正确的未来失败和教育目的。
ARP Monitor与802.3ad(LACP)不兼容。 切换到miimon 。