我们有一个基于大量不同的ProCurve L2和L3 GigE交换机的平面办公networking树,跨越了大约300个端口。 今天我发现networking中的一个设备在短时间内会导致过度的广播,导致大部分100Mbps链路饱和,影响某些服务,如VoIP。 设备连接到作为networking根交换机的ProCurve 3500yl交换机,因此风暴通过根交换机溢出到networking的其余部分。
问:是否有办法将问题本地化,避免风暴通过根交换机溢出?
这里有一些更具体的我的案例可能是相关的,因为我可能会问一个错误的问题,最好的解决scheme可能在别处。
造成风暴的设备本身就是一台ProCurve 3400cl(J4905A)PoE交换机,从2009年开始,其固件版本为M.10.76 。 我知道这是旧的,会在周末刷新最新的 。
3400cl连接到间歇性延长断电的电源。 当断电后恢复供电时,设备需要大约5分钟的时间才能启动。 此时,stream量通过设备,而设备及其链路尚未完全build立。 在这段时间内,它将networking上的各种不希望的stream量喷入networking,这些stream量很难被捕获,但是在通过SNMP收集的统计数据中却留下了一个高峰。
在此期间,我看到High collision or drop rate. See help. High collision or drop rate. See help. 消息在networking上的许多100Mbps端口。
3400cl通过两条物理GigE链路连接到3500yl。 3400cl运行RSTP,3500ylconfigurationMSTP生成树协议。 在正常运行期间,其中一条链路在3400cl被RSTP禁用,另一条链路正在转发。
当3400cl重新启动时,我可以在3500yl的日志中看到以下消息
14:05:03 ... port 37 is now off-line 14:05:04 ... port 38 is now off-line 14:05:51 ... port 37 is blocked by STP 14:05:51 ... port 38 is blocked by STP 14:05:54 ... port 37 is now on-line 14:05:54 ... port 38 is now on-line
然后我看到连接到3500yl的100Mbps端口和连接到它的下层交换机的High collision or drop rate 。
14:07:11 ... port NN-High collision or drop rate. See help.
此外,VoIP用户正在经历中断。
我可以尝试的唯一直接措施是在3500yl端口上设置broadcast-limit 5 。 我不确定,也不能testing是否有帮助。 此外,这感觉非常像一个特别的解决scheme。