思科接入交换机正在下降大量的终点

今天下午,没有改变networking,交换机突然开始断开大量的连接。 这些连接会在几分钟后回来,然后连接到交换机的另一个区域将会掉线。 这是一个较旧的4006机箱交换机,本身可能是一个问题,但我期待着看看你们在寻找根源方面还有什么可以寻找的。

开关通过以太网通道中的端口1/1和1/2连接到VSS核心1/1/42和2/1/42。 双方都能正常工作,但是交换机上的CPU会高达99%,而CRC错误在这些接口中的一个上开始碰到VSS核心,并且端点开始下降。 我们尝试了链路两端的新收发器和SFP,结果相同。 当我们尝试交换接入交换机上的光纤跳线时,CRC错误没有遵循它们留在接入交换机上的1/2端口上的光纤电缆。 因此,监控模块上的端口1/2看起来像是罪魁祸首。 实际上,我们尝试通过将光纤介质转换器转换为cat5来创build一个新的以太网通道成员,并使其成为端口通道的成员,但是当我们将其插入时甚至无法到达交换机。 我猜这是与媒体转换器无关的问题。

截至目前,我们只剩下一根光纤连接到VSS核心的一端(1/1接入交换机 – > 2/1/42)。 我已经向TAC发送了一些信息,他们正在调查情况,但其他人是否有任何我可以运行的命令或一些疑难解答,我可以在此期间进行调查?

这种幅度的CPU峰值通常是某种生成树事件(读取:循环)或过多的stream量触及控制平面(最常见的广播/多播风暴)。

4006是否连接到其他任何下游交换机? 有没有可能将4K意外交叉连接到另一台交换机上?

你是否在这些交换机端口上绘制stream量? 寻找更高的stream量。 TAC也将想知道哪个进程正在消耗所有的CPU – show proc cpu的主要消费者是什么? 你是否也看到4K的高CPU利用率?

同样,在你看到高CPU的时代,是否有不寻常的syslog? 在这一切开始的时候,对networking或主机的任何改变? 在更简单的层面上,左侧LACP端口通道configuration是什么样的? 静态的? 在这个领域的configuration错误可能会导致一些问题的行为。