由于死亡端口,我们推动更换我们的数据中心的Linksys /思科SR2016。
所以我们看着我们的供应商的股票,他们唯一感兴趣的开关是思科SLM2024智能开关 – 所以我们得到了它。
我去了数据中心,configuration(设置IP),并在周六晚上更换了交换机,从那以后我们遇到了很大的麻烦。 大多数情况下,它可以正常工作,但是有时会出现1-20分钟的崩溃,给所有连接的服务器造成大约90%的丢包现象,而且一切正常,交换机就可以正常工作。
截图
我们在那里的另一个交换机是Linksys / Cisco SRW2016,如果我将所有电缆从SLM2024切换到这个SRW2016,一切正常……我敢肯定,没有循环。
上行电缆连接到Catalyst 37xx系列交换机…
我问过远程办公室的技术支持人员,如果他们以前没有遇到过类似的问题,但是他们说没有 – 我希望完全确定问题出在交换机上,然后再交给供应商(因为我不完全确定我应该如何展示它)。
感谢您的意见!
如果您在交换机上查看您的生成树统计信息,可以告诉您更多关于循环的可能性,请查找拓扑时间。 发生环路时,拓扑结构会不断重新构build以补偿环路,因此更高的拓扑时间(5小时或更长)表示无环路networking。
Broadcomm pro系列NICS和我的阿尔卡特交换机听起来有些问题,听起来与您所遇到的非常相似。 直到我发现它实际上是交换机上的自动协商,这是非常间歇和令人沮丧的。
我通过禁用autonegfunction和硬编码所有端口的速度和双工来解决这个问题。 这真的是一个服务器环境的最佳做法,无论如何,我只是懒惰,并认为我会让自动处理它。
你可以做的另一件事是运行数据包捕获段,看看你是否以某种方式获取重置帧或sorting错误。
另外看看你在交换机上的stream量控制设置。
你看到交换机上的服务器之间的数据包丢失“或者”一端交换机上的服务器与另一端服务器之间的数据包丢失“,但是本地服务器之间没有问题”?
如果是后者,我将首先在上行链路的两端硬configuration速度和双工。 或者,至less要确保两端都是钉牢(或自动协商)的。
你所描述的听起来像一个循环。 我会首先仔细检查电缆。 除了环路或交换机本身是问题之外,您可能还可以看看哪些端口通过它们推送最多的stream量,然后从那里search这些端口上的设备。 您也可以尝试在其中一台发生数据包丢失的服务器上运行Wireshark,以查看中断时服务器在networking上看到的内容。