当服务器联机时,大量的数据包丢失

这是ubuntu服务器的延续,ssh,写入失败:破pipe道 。 我开始了一个新的问题,因为我不相信这个问题是孤立的SSH / Ubuntu的。

我有两台安装了Ubuntu服务器10.04 64位的全新服务器(Dell PowerEdge R715,R210)。 我使用两台Juniper SRX240防火墙/路由器运行一堆Cisco 3750交换机。 该设置基本上是一个棒上的路由器,我们有3个vlans:一个内部,一个dmz和一个存储networking(iSCSI),都在同一个堆栈上。 思科堆栈上没有进行第3层交换,并且DMZ在不同的交换机上完全与堆叠隔离。

在同一networking(和堆栈)上还有大约10台Dell PoerEdge服务器已经运行多年,没有问题。 他们中的大多数都运行SLES 10或者openSUSE,但是其中一个运行Ubuntu服务器10.04 64位。 我已经拔除了这些新服务器上的所有NIC,除了那些去我们的内部VLAN。

如果我启动其中一台(或两台)机器并让它们静置十分钟左右,我们就会开始从networking上的其他机器丢失高达20%的数据包丢失,并从违规的服务器中丢失高达40-50%的数据包。

有没有人有一个想法,为什么这可能会发生,或者我可以解决这个问题? 如果必须的话,我不介意擦这些盒子,还没有任何生产数据。

我首先看看交换机日志缓冲区(或者你输出的系统日志,如果有的话)。

过去我发现多NIC NIC机器不恰当地响应ARP(如“不在预期的接口”中),甚至在有多个VLAN连接到交换机的刀片服务器机箱中的刀片问题更多,但是在实际的刀片交换机上没有(工作)实施VLAN的方式。 这应该在日志中显示为与MAC有关的投诉。

作为第二步,如果在新服务器上的所有接口上启用arp_filter,情况会变得更好吗?

我有一个类似的问题,这是由多个VMconfiguration相同的MAC地址引起的。 只是生成一个新的解决了这个问题。

我遇到了同样的问题 – 但也有多个虚拟机。 原来是我的机器上的防火墙设置。