试图确定在FC链路上是否存在间歇性的DC间等待时间,但只能访问DCX 8510的OID计数器。由于它是DWDM上的L1链路,服务提供商没有统计数据来测量任何可能的问题因为问题是间歇性的,所以连接的testing套件总是干净的。
当这个问题发生的时候,看到这个OID的值就会上升,但是试图find正确的信息真的很难。
swfcportrxbados
任何帮助更好的解释这个OID和指向一些信息,以更好地理解SNMP输出将不胜感激
swFCPortRxBadOs跟踪无效的有序集的数量,大部分时间对于物理或虚拟接口是错误的,它也可以应用于背板。
对于DWDM或直连FC(无论是Cisco还是Broccade),无效的有序集通常是主机或节点性能不佳的结果。 在DWDM的另一端磁盘提示长度大于6的RAIDarrays可能会导致虚拟通道超时。 这通常意味着你有虚拟频道被卡住。 当交换机端口耗尽所有可用信用时,连接到设备的交换机端口需要保留额外的出站帧,直到设备返回信用才能进入缓冲区。 当设备在超时时间内没有响应时,发送交换机将会保持更长的帧,导致高的缓冲器占用。 这会导致交换机将其返回缓冲信用的速率降低到其他发送交换机。 然后通过交换机传播(可能有多台交换机,设备试图向主机发送帧,或者交换机连接到具有高延迟主机或交换机的交换机),并影响交换matrix的性能。
可能的罪魁祸首
Physical Layer Badness(物理层不良) – SFP正在或正在发生故障,而另一侧或交换机正在查看。
虚拟频道“卡住” – 上面的解释。 如果虚拟频道卡住了,那么它不会传递stream量或信号,你会看到er_bad_os计数器增加。
博科build议在FOS中启用bottleneckmon。 当没有任何stream量的时候有两秒钟的窗口,它将重置VC(虚拟频道)。
bottleneckmon -cfgcredittools -intport -recover onLrOnly
当一个或多个信用点丢失时,它将开始寻找重置VC的窗口。
这是关于Fabric弹性最佳实践的很好的PDF http://www.brocade.com/downloads/documents/html_product_manuals/NOS_MIB_301/wwhelp/wwhimpl/common/html/wwhelp.htm#context=NOS_MIB_v301_HTML&file=5_sw-mib.06.4.html
使用portstatushow为您的端口,看看你是否得到一个er_bad_os 591691无效的有序集
它可能会给你一个保证,你所经历的是一个无效的有序集,所以你可以开始排除你的信用和缓冲区,这是经常出现这些types的问题。