我使用Nagios监视大约30台Cisco 2960交换机(check_snmp_load,check_snmp_int)。 我只检查负载和每个交换机的一个或两个主干接口。 由于缺乏设备答案,我得到了很多误报。 我想SNMP的UDP数据包丢失的地方,但我一直无法排除故障。 我在每台交换机上检查了sh int summary ,没有关于丢弃的数据包(IQD和OQD)的信息。
同一个Nagios实例监视数十个其他设备(Linux服务器,iDRAC / iLO,SAN交换机,磁带库等),总是有一切正常。
Nagios和2960s /其他设备之间基础设施连接的唯一区别是2960s通过相当老的FC基础设施连接。 这有可能是FC电缆的问题吗? 我怎样才能检查它(没有购买昂贵的networking测量)? 我已经使用iperf,但没有显示任何问题。
我还能做些什么来解决这个问题?
更新:我在2960s的SNMPconfiguration非常简单:
#sh run | include snmp snmp-server community commstr RO
在交换机上,您可以启用
deb snmp packet
那么你会看到每个snmp包进出你的交换机。 在nagios服务器上使用tcpdump或tskark(wireshark)进行networking嗅探。 如果同时监视两者,则应该能够说出问题是否由丢包引起。