Articles of packetloss

当服务器联机时,大量的数据包丢失

这是ubuntu服务器的延续,ssh,写入失败:破pipe道 。 我开始了一个新的问题,因为我不相信这个问题是孤立的SSH / Ubuntu的。 我有两台安装了Ubuntu服务器10.04 64位的全新服务器(Dell PowerEdge R715,R210)。 我使用两台Juniper SRX240防火墙/路由器运行一堆Cisco 3750交换机。 该设置基本上是一个棒上的路由器,我们有3个vlans:一个内部,一个dmz和一个存储networking(iSCSI),都在同一个堆栈上。 思科堆栈上没有进行第3层交换,并且DMZ在不同的交换机上完全与堆叠隔离。 在同一networking(和堆栈)上还有大约10台Dell PoerEdge服务器已经运行多年,没有问题。 他们中的大多数都运行SLES 10或者openSUSE,但是其中一个运行Ubuntu服务器10.04 64位。 我已经拔除了这些新服务器上的所有NIC,除了那些去我们的内部VLAN。 如果我启动其中一台(或两台)机器并让它们静置十分钟左右,我们就会开始从networking上的其他机器丢失高达20%的数据包丢失,并从违规的服务器中丢失高达40-50%的数据包。 有没有人有一个想法,为什么这可能会发生,或者我可以解决这个问题? 如果必须的话,我不介意擦这些盒子,还没有任何生产数据。

Nagios,Cisco交换机,丢失的数据包

我使用Nagios监视大约30台Cisco 2960交换机(check_snmp_load,check_snmp_int)。 我只检查负载和每个交换机的一个或两个主干接口。 由于缺乏设备答案,我得到了很多误报。 我想SNMP的UDP数据包丢失的地方,但我一直无法排除故障。 我在每台交换机上检查了sh int summary ,没有关于丢弃的数据包(IQD和OQD)的信息。 同一个Nagios实例监视数十个其他设备(Linux服务器,iDRAC / iLO,SAN交换机,磁带库等),总是有一切正常。 Nagios和2960s /其他设备之间基础设施连接的唯一区别是2960s通过相当老的FC基础设施连接。 这有可能是FC电缆的问题吗? 我怎样才能检查它(没有购买昂贵的networking测量)? 我已经使用iperf,但没有显示任何问题。 我还能做些什么来解决这个问题? 更新:我在2960s的SNMPconfiguration非常简单: #sh run | include snmp snmp-server community commstr RO

挂断故障排除包丢弃

我的networking由思科交换机组成。 我看到有相当数量的数据(每天数以百万计的数据包)在两台交换机之间传输。 一个是3750,另一个是3560.这个链路的峰值吞吐量只有400Mbps以上,所以不应该是带宽问题。 在这一点上,我有点无知在哪里看什么工具,我可以用来确定什么包丢弃,为什么。 我可以在那个链接上设置一个SPAN端口和Wireshark,但是我不知道是否可以告诉我任何事情。 有没有人有什么build议?

是什么导致从Debian服务器到最近的网关丢包?

我有一个用ISP托pipe的debian Squeeze KVM服务器。 服务器没有太多的负载(平均为0.1),并且具有足够的内存,低networkingstream量,低磁盘I / O等等。它运行标准LAMP设置,安装了所有最新的deb包。 没有安装exception的软件。 但是,当我ping最近的网关时,平均有8%的数据包丢失(cron作业每10分钟执行100个ping),有时甚至高达40-50%的数据包丢失,尽pipe服务器负载是稳定的。 从外部ping服务器也会导致数据包丢失。 这里有什么可能是错的?

PacketLoss通过互联网“Linux-Linux”,但不是“Windows-Linux”(tl; dr:它是MTU)

我现在正在争取在互联网上的机器之间造成数据包丢失的现象。 检查下图。 请注意,每当我使用“SSH”,我可以使用“HTTPS”; 该协议发生相同的现象。 运行Fedora 22的SSH服务器位于“站点A”(酒红色)。 直到“最近”才有连接问题。 从运行Fedora 22或Fedora 23的Amazon EC2计算机到“站点A”的SSH连接工作良好(在“Amazon EC2”框中显示为绿色的主机) 从同一AS上的“站点B”到“站点A”的SSH连接不能在我testing的任何Fedora系统上运行(橙色框)。 但是,他们使用Putty从Windows 7系统上工作。 两种情况都涉及相同的(双引导)硬件。 “站点B”也有一个防火墙,但似乎没有任何作用:我试图直接从FritzBox路由器build立连接,它仍然不适用于Fedora,但为Windows工作。 问题如何performance出来: 使用SSH进行连接时,会有一个初始数据包交换(如tcpdump所示)。 然而,在20个数据包左右之后,传出的数据包似乎已经不在任何地方了, 没有确认从站点A回来。您永远不会到达密码提示。 一个CTRL-C正确地重置连接,之后Linux仍然尝试发送一些从未被确认过的数据包。 我怀疑在我的ISP有一些问题,特别是我怀疑ISP执行可疑的魔术,以便实施站点B的“固定IP地址”,这是唯一改变“最近”的东西。 然而,我不明白什么可以说明一个SSH连接在Windows上工作,而不是在相同的条件下,在networking上工作。 我该找什么? 这里(Amazon S3)是失败的SSH连接的tcpdump

PIX防火墙导致数据包丢失

我目前正在修改互联网到达我的前端服务器的过程,我对现有的一个堆栈有一个奇怪的问题。 在服务器上面有一个物理防火墙,如果我使用这个防火墙,我开始在整个子网上接收数据包丢失,如果我使用wireshark,我可以看到ARP请求,但是我仍然会丢失数据包。 第二我把这个防火墙拿出来,问题消失了。 如果我绕过防火墙直接到前端服务器,我仍然没有得到任何问题。 所有这一切使我相信我的configuration一定有什么问题,但我看不到我的生活: interface ethernet0 100full interface ethernet1 100full interface ethernet2 auto shutdown nameif ethernet0 outside security0 nameif ethernet1 inside security100 nameif ethernet2 intf2 security4 enable password ************ encrypted passwd ************ encrypted hostname sbc-cfw-02 fixup protocol dns maximum-length 512 no fixup protocol ftp 21 no fixup protocol h323 h225 1720 no fixup protocol […]

当从路由器ping时,不明原因的0.1%数据包超时

我正在对一个需要能够通过卫星链路从路由器发送5000个ping到远程站点的客户进行故障排除,但是他们每次testing都会遇到一到五个丢包。 在一般情况下,我愿意把卫星链路的成本降低到一个很低的水平,但是从路由器到远程站点ping的时候才会出现丢包现象。 为了澄清,这里涉及的networking设备: 出站stream量 192.1.1.51路由器集线器 192.1.1.52 TX交换集线器 192.1.1.50封装器集线器 172.1.1.1远程站点远程 返回stream量 172.1.1.1远程站点远程 192.1.1.28信道单元集线器 192.1.1.53 RX交换机集线器 192.1.1.51路由器集线器 当从路由器ping到远程站点时,显示出损失。 当从连接到TX交换机的Sun服务器(绕过路由器)进行ping时,5000个ping完成而没有一个丢失。 这validation了整个卫星path以及除路由器之外的所有设备。 然后,我尝试从路由器发送5000个ping到除了远程站点之外的所有其他设备……我几乎立即收回了全部5000个,因此从路由器到path中的所有其他设备的连接被validation为良好。 有问题的路由器是Cisco 7206VXR,cpu利用率似乎没有超过50%。 最高的过程只有20%,所以我不确定这是路由器丢弃ICMP报文的原因,因为路由器发送5000个数据包到本地设备是没有问题的。 我也研究了一个空路由的可能性,但根据客户的说法,唯一可能的罪魁祸首是远程访问的基本路由,我不能在这里发布他们的运行configuration以获得第二个意见。 任何build议将不胜感激。 我的networking经验很less,而且我正在为了调和这些看似矛盾的症状而打我的头。

优化通过长时间有损通道连接的两台Linux主机之间的TCP连接

我有两个遥远的主人。 丢包总是19%,直到速率超过210kB / s。 RTT大约是220毫秒。 TCP拥塞控制algorithm是“立方体”。 “f_rto”已启用。 TCP连接的实际速度只能达到14 kB / s。 这真的很慢。 有没有关于如何优化两个主机之间的TCP连接的想法?

WAN优化的前向纠错

任何人都知道用户空间工具提供前向错误纠正与/在Linux上通过UDP隧道stream? 我发现Trafficsqueezer , utunnel和toutunnel实现TCP over UDP,但似乎没有提供前向错误控制。 (为了那些浏览这些问题的人,不熟悉WAN优化:带宽限制= MSS/(RTT*SQRT(p)) ,其中SQRT(p)是分组丢失的平方根)

在GNU / Linux上分析传入的TCP数据包丢弃

我使用Ubntu 12.04服务器作为网关/路由器。 该服务器有两个用于LAN和WAN接口的NetXtreme BCM5721千兆以太网PCI Express卡。 Opennms监控软件在WAN(ISP)接口上显示传入数据包丢弃。 ISP通过SDH / SONET环提供直接的以太网连接。 但是在LAN接口上我看不到任何数据包丢弃。 这是WAN接口图: 是否有任何工具/命令来发现什么是这种丢包的责任。 是否有可能知道ISP的一些错误configuration是否导致这样的问题。 Ifconfig输出: eth1 Link encap:Ethernet HWaddr **:**:**:**:63:5d inet addr:***.***.4.130 Bcast:***.***.4.131 Mask:255.255.255.252 UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1 RX packets:865089489 errors:0 dropped:596 overruns:0 frame:3 TX packets:498072410 errors:0 dropped:0 overruns:0 carrier:0 collisions:0 txqueuelen:1000 RX bytes:1092458492329 (1.0 TB) TX bytes:48179244881 (48.1 GB) Interrupt:17