AT&T U-verse IRC,SSH等会议下降

AT&T U-verse光纤24Mbit down / 3Mbit up
2线路由器型号3800HGV-B
软件版本6.1.9.24-enh.tm

我们的速度与广告一样。 AT&T互联网连接速度很快。 问题不在于速度。

问题是我们的IRC和公共互联网上的远程主机的SSH会话持续时间不会超过几秒或几分钟。 2Wire上的TCP会话超时configuration为86400.与我们的LAN上的服务器的SSH会话按预期运行。 我们的局域网似乎不是问题。 这个问题似乎是2Wire路由器。 我无法在2Wire路由器上获得shell,所以我不能在那里运行tcpdump等。局域网上的Tcpdump告诉我们,每个会话丢失都是由远程服务器启动的TCP重置导致的。 这是我的理解,从谷歌search,TCP重置正在发送,因为远程主机已经决定了TCP会话出了问题,这又使我怀疑2Wire路由器上发生了什么事情。 从许多types的其他互联网连接,移动networking连接,时代华纳有线电视,我们的T1在另一个办公室等这些相同的远程服务器的IRC和SSH会话行为如预期没有问题。

所有这一切都工作正常,直到我们切换到AT&T,并开始使用2Wire。 AT&T的整个时间,现在两个星期,我们有这个问题。

在我们办公室的高峰时段,我们有大约50台设备,笔记本电脑,台式机,移动设备,使用这个互联网连接。 在我们的局域网上,我尝试了几个已知的工作(与其他提供者)pipe理交换机等。 我试过让每个人只连接到2Wire无线SSID等。这些尝试隔离问题都没有改变这个问题似乎指向2Wire路由器。

一般来说,当办公室人数很less的时候,我们的IRC和SSH会话将会持续更长时间,超过几分钟。 有时会议会在5秒钟内下降,但有时如果我是办公室里唯一的会议,我可以保持开放10分钟以上。

如果问题是2Wire路由器,我不知道它是什么或如何解决它。 我也不知道如何解决它,并找出它是什么。

tcpdump输出在我们的局域网上捕获的SSH会话丢失,从远程服务器发送的TCP重置:

10:51:33.357748 IP (tos 0x10, ttl 63, id 11177, offset 0, flags [DF], proto TCP (6), length 52) 2wire.ip.53096 > remote.server.ip.22: Flags [.], cksum 0xd8bb (correct), seq 3878, ack 3193, win 65535, options [nop,nop,TS val 904726345 ecr 194200103], length 0 10:51:33.357757 IP (tos 0x10, ttl 63, id 54768, offset 0, flags [DF], proto TCP (6), length 52) 2wire.ip.53096 > remote.server.ip.22: Flags [.], cksum 0xd86b (correct), seq 3878, ack 3273, win 65535, options [nop,nop,TS val 904726345 ecr 194200103], length 0 10:51:33.456382 IP (tos 0x10, ttl 63, id 37832, offset 0, flags [DF], proto TCP (6), length 100) 2wire.ip.53096 > remote.server.ip.22: Flags [P.], seq 3878:3926, ack 3273, win 65535, options [nop,nop,TS val 904726346 ecr 194200103], length 48 10:51:33.493452 IP (tos 0x0, ttl 48, id 35965, offset 0, flags [DF], proto TCP (6), length 100) remote.server.ip.22 > 2wire.ip.53096: Flags [P.], seq 3273:3321, ack 3926, win 157, options [nop,nop,TS val 194200137 ecr 904726346], length 48 10:51:33.493757 IP (tos 0x0, ttl 48, id 35966, offset 0, flags [DF], proto TCP (6), length 132) remote.server.ip.22 > 2wire.ip.53096: Flags [P.], seq 3321:3401, ack 3926, win 157, options [nop,nop,TS val 194200137 ecr 904726346], length 80 10:51:33.494297 IP (tos 0x10, ttl 63, id 12429, offset 0, flags [DF], proto TCP (6), length 52) 2wire.ip.53096 > remote.server.ip.22: Flags [.], cksum 0xd7e7 (correct), seq 3926, ack 3321, win 65535, options [nop,nop,TS val 904726347 ecr 194200137], length 0 10:51:33.494485 IP (tos 0x10, ttl 63, id 28130, offset 0, flags [DF], proto TCP (6), length 52) 2wire.ip.53096 > remote.server.ip.22: Flags [.], cksum 0xd797 (correct), seq 3926, ack 3401, win 65535, options [nop,nop,TS val 904726347 ecr 194200137], length 0 10:53:04.123228 IP (tos 0x0, ttl 255, id 48599, offset 0, flags [DF], proto TCP (6), length 40) remote.server.ip.22 > 2wire.ip.53096: Flags [R.], cksum 0x9bbf (correct), seq 3401, ack 3926, win 0, length 0 

有没有其他人有这个问题,解决了这个问题? 还是有人有任何疑难解答,确定和解决问题的build议?

更新:
首先非常感谢您阅读这个长长的问题和答复。 +1

我也怀疑NAT转换表,但显然不够可疑。 我已经猜到了2Wire或任何设备可以处理2 ^ 16会议。 我猜错了:

我之前没有看到2Wire的会话表,但根据你的build议,我去找它,很容易find:

 session table 15/1024 available, 0/512 used in inbound sessions: 

上面的会议表细节是从下午的时候开始的,当时我们办公室的四分之一不在他们的办公桌旁边使用他们的电脑,我们已经接近了1024个并发会话的限制。

另外,“uverse会话表”的searchfunction也给了我一些有用的search结果。

作为一个住宅装备,我最初的直觉反应是它不能支持所有并发的TCP连接和NAT转换(并为那些超出限制的伪造重置数据包)。

我很难在设备上find规格来确认我的怀疑,但在寻找它们的时候,似乎有很多证据支持这一理论。

有什么办法来检查它运行多less连接?

你已经用真正的故障排除了你的基地。 我会打电话给ATT,并让他们运行关于第1层和第2层问题的连接的诊断。 你有访问网关吗? 它是否为您提供任何诊断来解决问题?

我知道它是一种不同的技术,但是当我支持DSL的时候,如果客户端离DSLAM太远,并且接线问题导致衰减,您会看到类似的东西。 我会在网关处启动(直接插入,无线!),然后按照您的方式工作。 如果这是一个商业级的线路,ATT应该能够把他们从前线队伍一路解决到NOC,看看是否有问题。