奇怪的思科交换机问题 – 与终极packetloss分钟

由于死亡端口，我们推动更换我们的数据中心的Linksys /思科SR2016。

所以我们看着我们的供应商的股票，他们唯一感兴趣的开关是思科SLM2024智能开关 – 所以我们得到了它。

我去了数据中心，configuration（设置IP），并在周六晚上更换了交换机，从那以后我们遇到了很大的麻烦。大多数情况下，它可以正常工作，但是有时会出现1-20分钟的崩溃，给所有连接的服务器造成大约90％的丢包现象，而且一切正常，交换机就可以正常工作。

截图

我们在那里的另一个交换机是Linksys / Cisco SRW2016，如果我将所有电缆从SLM2024切换到这个SRW2016，一切正常……我敢肯定，没有循环。

上行电缆连接到Catalyst 37xx系列交换机…

我问过远程办公室的技术支持人员，如果他们以前没有遇到过类似的问题，但是他们说没有 – 我希望完全确定问题出在交换机上，然后再交给供应商（因为我不完全确定我应该如何展示它）。

感谢您的意见！

如果您在交换机上查看您的生成树统计信息，可以告诉您更多关于循环的可能性，请查找拓扑时间。发生环路时，拓扑结构会不断重新构build以补偿环路，因此更高的拓扑时间（5小时或更长）表示无环路networking。

Broadcomm pro系列NICS和我的阿尔卡特交换机听起来有些问题，听起来与您所遇到的非常相似。直到我发现它实际上是交换机上的自动协商，这是非常间歇和令人沮丧的。

我通过禁用autonegfunction和硬编码所有端口的速度和双工来解决这个问题。这真的是一个服务器环境的最佳做法，无论如何，我只是懒惰，并认为我会让自动处理它。

你可以做的另一件事是运行数据包捕获段，看看你是否以某种方式获取重置帧或sorting错误。

另外看看你在交换机上的stream量控制设置。

你看到交换机上的服务器之间的数据包丢失“或者”一端交换机上的服务器与另一端服务器之间的数据包丢失“，但是本地服务器之间没有问题”？

如果是后者，我将首先在上行链路的两端硬configuration速度和双工。或者，至less要确保两端都是钉牢（或自动协商）的。

你所描述的听起来像一个循环。我会首先仔细检查电缆。除了环路或交换机本身是问题之外，您可能还可以看看哪些端口通过它们推送最多的stream量，然后从那里search这些端口上的设备。您也可以尝试在其中一台发生数据包丢失的服务器上运行Wireshark，以查看中断时服务器在networking上看到的内容。