我的思科交换机端口坏了吗?

在过去的几天里,我一直在内部networking上为less数最终用户追逐丢包和networking稳定性问题……这些问题上周浮出水面,但是这个位置在六个星期前被闪电击中

我看到一堆四个Cisco 2960和一个77米长的另一端的几台电脑和手机之间有5-10%的数据包丢失。 PC通过中继链路( switchportconfigurationpastebin )与电话内联运行。 我们看到客户端服务器应用程序和Microsoft Exchange连接中断电话和中断。

我尝试了远程的常见故障排除步骤,让本地技术人员在用户和生产活动rest期间执行以下操作:

  • 更换墙上的插孔和设备之间的电缆。
  • 更换配线架和交换机端口之间的跳线。
  • 尝试2960堆栈内的不同交换机端口。
  • 用已知好的设备(新手机,不同的PC)更换terminal用户设备。
  • 清除交换机端口接口计数器和密切监视增量错误。 ( sh int Pastebin输出 )
  • 钻研设备日志和Observium RRD图表 。 从交换机端没有链路up / down问题。
  • 更换最终用户端的电源条。
  • testing电缆从Cisco 2960运行,使用test cable-diagnostics tdr int Gi4/0/9 (clean)*
  • testing电缆使用Tripp-Lite电缆testing仪运行。 (清洁)
  • 在交换机堆栈成员上运行诊断程序。 (清洁)

最后,三个交换机端口的变化find了一个稳定的解决scheme。 唯一合乎逻辑的结论是,一些Cisco 2960交换机端口是坏的或片状的…没有死亡,但在行为上也不一致。 我不习惯看到个别端口以这种方式死亡。

还有什么我可以testing或检查,以确定这些设备是否坏?

什么是最佳实践方法来validation这一点?

单个港口是否有问题而不是连续的港口?


顺便说一句 – show cable-diagnostics tdr int Gi4/0/14是非常酷…

 Interface Speed Local pair Pair length Remote pair Pair status --------- ----- ---------- ------------------ ----------- -------------------- Gi4/0/14 1000M Pair A 79 +/- 0 meters Pair B Normal Pair B 75 +/- 0 meters Pair A Normal Pair C 77 +/- 0 meters Pair D Normal Pair D 79 +/- 0 meters Pair C Normal 

虽然港口银行往往共享一个ASIC,但每个都必须有自己的独立PHY。 如果物理层已经被破坏,那么邻居就不会有问题。

也就是说,产量下降是一个物理问题的一个奇怪的症状 – 不是不可能的,但不是典型的。 尽pipe存在半双工链路,输出下降通常与缓冲耗尽有关,而不是物理问题。

您可以通过在电线的另一端设置数据包捕获来获得更多信息。 一个不好的物理层可能会在链路的一端或两端出现一定数量的物理层错误(坏CRC,矮小/巨型等)。

总而言之,这听起来像你已经消除了足够的,它可能已经超过了收益递减的点。 如果你有合同,我会推荐一个RMA。

是的,一个端口可能不好,但我记得,你必须更换整个模块。 (注意:我已经完成了重要的思科工作已经很长时间了……)

我不确定是否可以帮忙,但是请查看Etsy的Ops工程师之一Laurie Denness的FITB 。