下载暂停,并经常超时

我是一个新的系统和networkingpipe理员。 我的经验已经在系统和服务器的硬件和软件上,networking部分对我来说很新颖。 我熟悉将数字插入networkingconfiguration,但如果你问我有关子网或数据包丢失(;),你会看到这真的失去了我的脸。 我在学。

这是我的问题:

在接pipe这些控制权之前的大约两个月之前,以前的networkingpipe理员报告他们在下载大文件时遇到了问题。 那么,不是真正的大文件,只是大的文件,更令人沮丧。 现在我正在做下载(从随机驱动程序到最新的发行版,从我们的Technet订阅和许可协议的SP,到我们各个部门的多GB工程软件包),我必须“亲身”下载,让我连续几个小时一直呆在我的办公桌上。

下载将开始很好,并得到一些随机点从几个K到一对夫妇G下载将失速,如果我不暂停,并重新启动下载失败之前,失败。 有时暂停/重新启动立即工作,下载提速并在循环重复之前进行一点。 有时我必须经过几次暂停/重启循环才能开始下载实际下载。

networking和ISP的详细信息:

  • 由我们的ISP服务的光纤互联网连接(我们的本地城市是我们的ISP)。 下载速度通常在1.1Mbps左右,峰值高达1.6Mpbs。 有时在暂停/重启周期中,我们会看到速度低至几百Kbps,但几个周期后,它会再次加速。 来自不同主机的速度是相当一致的。
  • 在我们的内部networking中没有代理,并且没有我知道阻止连接的防火墙。 我们使用Cisco 1811W作为我们的网关,但之前没有任何麻烦。

这个问题在9月左右首先被提到,在那个时候我们没有任何变化,我们可以把它归因于此。

我应该testing什么,检查等,以确定问题是在我们这边还是在ISP?

更新:

我正在看一个wireshark feed,过滤了一个大的下载的TCPstream,我现在用了几天的麻烦。 大多数交通框架被标记…

持续或非HTTPstream量

…我认为这只是后续的下载包。 然而,比较频繁(每3-20秒之间)以及与Firefox报告的下载速度中的任何下降几乎完全对应的是大部分帧被标记为…

[TCP重传]持续或非HTTP通信

也有一些随机帧,通常分布在重传数据包的左右几十帧,标记为…

[TCP上一段丢失]继续或非HTTPstream量

…和whadayaknow,下载只是通过3.2GB文件的一半失败。 最后的帧是一个TCP前一段丢失帧。 这是我不得不暂停下载并尝试重新启动之后立即排队立即失败。

下载的最后一帧是http [ACK],然后是http [FIN,ACK] ,我相信这表明了一个“优雅”的TCP连接closures。

我没有看到任何其他指示中介的中断。

更新2

在下载的所有浏览器和应用程序中都会出现该问题,并且在允许暂停/重新启动的所有应用程序中,暂停/重新启动function的工作时间为99%。 特定的应用程序和浏览器我可以很容易地在Firefox(当前版本),IE(9),iTunes(下载iOS设备的应用程序和更新)中进行复制。 我不确定这些全部是否在下载中使用相同的function作为暂停/恢复function。

从服务器的iTunes下载都允许重新启动(iOS更新文件除外),所以无论多久,我暂停下载。 我从MS(MS,PTC,Solidworks,AutoDesk)下载大文件的大多数站点不支持恢复停止/取消的下载(MS不过只能从那里的基于Java的下载pipe理器),所以我只能暂停大约15秒在尝试恢复之后,下载之前将立即失败。

更新3

使用mturoute(谢谢汤姆H),我发现一致的路由最大MTU是在分片之前1500个字节,并且path运载ICMP有效载荷与碎片从头到尾没有许多问题,包括跳跃通过我的ISPs设备。 所以这个问题似乎不是碎片或不兼容的MTU设置。

ICMP也没有被我的ISP封锁,也不是BitTorrent,虽然我没有使用BT来下载这些文件。

更新4

因此,从Wireshark日志来看,我需要看看如何确定重新传输和上一段丢失帧的原因。 我将如何隔离这些可能的来源?

通常情况下,您可以通过系统地validationnetworking的各个部分来解决问题。 这是一个有信心的过程,我知道这是通过使用适当的工具进行调查的工作,并通过部分你会到达拼图的最后一块,并说,我知道这是问题,因为一切都很好!

  1. 如果您可以在连接到以太网无线的设备上复制问题,那么可以将networking<=> Cisco 1811W <=> DSL光纤<=> ISP <=>与Internet之间的最终连接

  2. 如果只在有线networking无线设备上看到问题,则可以在Cisco 1811W上定位有线以太网或无线configuration。 然后,您可以查看有问题的部分共同的设置作为下一步。

  3. 通常重新安装任何常用的以太网电缆,并在testing某些设备时尝试交换DSL电缆(如果可用)。

  4. 检查路由器上为DSL设置的MTU和自动协商设置,从IOS查看路由器日志文件。

路由器将运行IOS 12或类似的东西,这将有一些很好的命令行工具通过ssh访问检查协商设置。

使用show interfaces命令查看错误统计信息,如重新发送和丢弃的数据包。 它甚至可能有一个networking界面(但我目前没有与思科IOS设备工作,所以这是不是只是从一些笔记我做了关于故障解决思科networkingtesting)

但是,您应该能够使用从cisco控制台上拉每个端口错误统计信息表

 # show interfaces status # show interfaces counter errors 

并为特定的端口,例如

 # show interface GigabitEthernet 5/28 status # show interface GigabitEthernet 0/24 switchport 

编辑: 这里是一些人显示如何使用ios“显示接口计数器错误”来解决问题的一个小video 。 实际上它确实很酷,但它可能太深入了,但它提供了检测双工不匹配或自动协商设置所需的信息。

ps你可以certificate连接的路由器部分,通过插入一个替代的DSL路由器到光纤连接,如果下载工作find他们,你知道问题是这边,而不是ISP方。

一些ISP做出奇怪的决定 ,阻止交换机或防火墙上的所有ICMP数据包。 这将阻止pathMTU的计算,这意味着当您通过MTU较低的路由时,会发生更多的分片数据包。 也许你正在看到这个结果。

碎片化的数据包必须重新组合,这可能是一个问题,如果你也有数据包丢失! 鉴于您正在尝试下载大文件,分组和分组丢失将是一个更大的问题。 pathMTU发现旨在减less碎片。

那么你怎么知道你的ISP是否已经这样做了? 你可以问他们 – 但是,根据我的经验,互联网服务供应商更愿意在几天/几周的时间里把基本的故障排除给你,而不是承认他们可能做错了什么。 当然有时他们是对的!

你应该收集信息,向他们展示你所看到的。 数据包捕获就像你在Wireshark中完成的或在防火墙上收集的数据包一样有帮助,因为它们经常揭示碎片的级别。 您可以使用tracepath (* nix)或mturoute (Windows)检查pathMTU发现是否正在工作。

如果您发现pMTU不能正常工作,则可能是您的ISP或您尝试从中下载的网站的ISP。 如果您发现从多个网站下载的问题,则可能是您的ISP。

当然,这也可能是一大堆其他的东西:-)祝你好运!

你使用BitTorrent下载这些大文件? 许多ISP已经安装了专用硬件来检测和限制stream量滥用者。

我会打电话给你的ISP询问他们有什么计划,他们是否知道任何stream量整形或节stream。

这是我的ISP使用的:

http://www.sandvine.com/

我将把它作为OP的练习来决定如何绕过任何这种硬件/软件速率限制设备,如果它们被发现存在。

只是好奇,这些都是Windows 7的机器? 我有一个类似的问题,只影响Win 7的机器。 这个不太可能的解决scheme起作用了,我从来没有更快乐过。

尽pipe我的问题最初是关于电子邮件的,但我很快意识到,这个问题几乎涉及networking的任何事情。 Microsoft修复程序非常简单,而且现在我正在configuration所有W7计算机预部署。 从那以后,我一直没有任何问题。

这里是问题: 原来的问题

问题解决了!

这个问题是非常难以诊断的,因为它发生的不规则,虽然不经常,也不经常(是的,这是一个矛盾,我会忍受它)。

最终,这个问题似乎越来越严重,影响了我们之间的联系的其他方面,而且我能够用这种方式来解决这个问题,而且我很清楚,这个问题不在我们的networking中。

我们的ISP(当时)是转售AT&T的连接,所以我跟经销商谈过,首先向他们介绍了我收集的信息(这是从内存中获得的,大概在6个月前解决了这个问题, ,抱歉)certificate这个问题不是我们networking的内部问题。 他们发现自己的一台交换机出了问题,换了一台交换机,但是这并没有解决问题,所以他们做了testing,发现了AT&T上游的问题,AT&T能够证实和解决问题。

我不完全确定这个问题只是在AT&T。 根据症状如何升级,我想说升级是由于AT&TS方面的问题,但最初的问题是我们本地的ISP,所以我们在那里有一个信任问题。

我们交换了ISP,然后由于这个原因离开本地经销商,然后去了AT&T。 我知道,从煎锅里走进火里。 但是现在我们付出的代价要less得多,AT&T一看到他们的问题就修正了,这在我们的书中是可以的。