Linux绑定接口定期挂起

我有几台主机显示连接问题。 例如,当从命令行工作时,键入被冻结一秒钟左右,然后恢复 – 然后再次执行。

最令人震惊的例子主机会冻结(input)15-30秒,然后恢复并在5秒后出去。 交换电缆没有做任何事情 – 但删除其中一个物理电缆导致一切立即清理(为什么我认为这是一个networking问题)。

看看networking,我看不到任何数据包浮动,这将解释这一点。

这些以太网接口(千兆位戴尔)以前正常工作的,但是由于我们移动了这些系统并将它们放在了一个新的交换机上,这在多个理论上相同的configuration主机上已经成为一个问题。

原来的交换机是HP ProCurve 1810-24G和HP ProCurve 1800-24G连接LLDP; 新的交换机都是Cisco SG 200-26,据我所知,它是重新命名的Linksys交换机。

这是由交换机的问题引起的? 它是开关configuration吗? 思科交换机是不是无法处理这个问题?

我看不到configuration的位置; 我search了通常的/etc/sysconfig/network/devices但是没有任何关于选项的内容(如mii轮询),没有任何关于平衡两者的方法。 search脚本,我在/etc/init.d/network也找不到任何东西。

主机几乎都是红帽企业Linux 5.x系统(5.6,5.7),但有些是Ubuntu Server 10.04.3 Lucid Lynx。 如果涉及到的话,我需要帮助。

更新:我们也看到原来的交换机上的服务器的一些问题。

惠普交换机和思科交换机也相互连接(暂时); 从一台交换机到另一台交换机都有一根电缆。 在这些主机上ping任何一个显示大约一个ICMP数据包,每5-6个被丢弃(超时)。 两个交换机之间可以有交互吗?

哦,主机正在使用与Balance-RR的绑定作为方法。

更新:其中一个Cisco交换机正在使用思科发现协议(CDP),即使此ESXi服务器连接到HP交换机,我们的VMware 4 ESXi主机也正在使用它。

更新:我更新了思科交换机并closures了CDP,LLDP-MED和STP – 惠普交换机不支持CDP或STP,并且它们似乎不支持LLDP-MED。 所以这一切都closures了。 这清除了连接到HP的旧networking上的主机上的问题 – 但是另一侧的主机仍然显示不可接受的丢包率 – 但只有一些主机。

没有绑定接口的主机显示没有问题。 一两个这样的主机根本就没有绑定接口; 一个具有绑定接口,但是一个端口被断开。

如果我手动取下一个从属接口会发生什么? 绑定接口如何处理?

更新:通过testing,似乎把function奴隶以太网接口不杀死整个事情(这是应该的方式)。 在选定的主机(但不是全部)上做这件事清除了问题; 由于某种原因,连接到某些主机丢弃了大量的数据包,其他系统没有遇到这个问题。 三台主机将绑定的接口简化为一个以太网端口,现在丢弃数据包似乎不再是一个问题。

当然,这并不能解决问题 – 它只是让它消失(这是目前的头号事情)。 下一步是在下一次去数据中心时检查物理布线 – 双端口应该在单独的交换机上,但是它们是? 将检查。

这里有一个关于Ubuntu绑定的链接: https : //help.ubuntu.com/community/UbuntuBonding

至于它们通常取决于你正在使用哪种绑定模式。 如果使用模式4,则需要为思科设备configuration交换机,通常需要设置LACP。 不知道你有那些模型。

其他绑定模式不需要任何特殊的交换机configuration,通常取决于您是否希望将冗余作为主要或input或输出负载平衡来select您select的模式。

这里是RHEL6的链接

http://docs.redhat.com/docs/en-US/Red_Hat_Enterprise_Linux/6/html/Deployment_Guide/sec-Using_Channel_Bonding.html

RHEL5

http://docs.redhat.com/docs/en-US/Red_Hat_Enterprise_Linux/5/html/Deployment_Guide/s2-networkscripts-interfaces-chan.html

正如John所说,使用模式4需要在交换机上启用802.3ad或LACP协议。 您可能需要使用模式2(主动备份)进行testing,或者使用模式6(自适应负载平衡)。