networkingstream量监测

监控/分析整个networking(几个子网)的networkingstream量的最佳工具是什么?

我正在寻找一些能够帮助我解决带宽问题的方法,例如,用户开始抱怨“networking速度慢”

我假设你有一个商业路由器/交换机,它很可能有SNMP ,你可以结合MRTG一个很好的stream量图。

我认为你最好的select是将Cacti和Ntop混合使用。

ntop将为您提供有关networkingstream量的信息,例如消耗最多的主机…什么stream量导致速度下降等…

Cacti将会给你带宽消耗的长期趋势,这样你就可以知道你的networkingstream量是如何随着时间而改变的。

当用户报告“networking问题”时,问题可能与许多问题(路由,交换,主机configuration,单播,多播,安全策略,硬件故障)有关。 你不可能find一个软件来监视你所有不同的潜在问题。

相反,重点放在两件事上:

  • 仪器仪表 :提出一个监测策略,可以让您主动监测定期发生的故障。 看到这个以前的答案更详细。

  • 故障排除 :提出一系列快速,标准的testing,您可以立即尝试并找出问题所在,并将其发布给用户。

一些示例testing:

  • ping你的默认网关
  • ping另一台主机在同一个子网上
  • ping一个closures子网主机
  • 你得到什么样的数据包丢失?
  • 数据包大小不一样?
  • 你能成功地从命令行telnet到目的IP /端口吗?

这些简单的诊断通常可以很快地指向正确的方向。 最后,如果可以的话,总是得到一个源IP,一个目的IP和一个目的端口。 尝试和教育你的用户; 像“networking速度慢”这样的恶意抱怨是不容易诊断的。

尝试MRTG和/或ntop 。

我一直在家里使用光滑墙 ,取得了巨大的成功,它监测交通和一吨多。

它也出现在一个公司版本,也有一些更花哨的东西。

我试图找出为什么我一直用尽带宽(在澳大利亚我们有限制)原来是我的错:)

我正在一家拥有中小型networking(约500个用户)和大约十几个/ 24个子网(以及一些小型NATnetworking)的组织中工作。 我们使用各种监控软件,使我们能够监控networking的远程部分,并主动回应问题。

  • SNMP – 这构成了我们监控系统的基础。 所有的networking基础设施,至less需要支持SNMP并通过系统日志logging到中央服务器。
  • OpenNMS – 主要用于事件监控,尽pipe我们已经开始将其用于资产和性能跟踪。 我经常监视OpenNMS。 如果networking有问题,我想在有人打电话给我之前知道。
  • SFlow / Netflow – 确定有多lessstream量stream经networking的哪一部分以及哪个主机正在生成该stream量(例如,顶级谈话人/顶级听众),这非常有用。
  • 吸烟 – 这主要用于延迟和连接跟踪,尤其是无线网桥或其他麻烦的连接。
  • MRTG – 在不支持SFlow / Netflow的基础设施设备上的stream量监控是通过MRTG完成的。
  • Linuxnetworking“探测器” – 我们networking的某些部分无法通过devise到达,并且具有独立的物理离散连接。 一个安装了Linux的旧工作站在networking段上有一个存在点,这使得我们可以使用前面提到的Smokeping和MRTG等工具来关注这些段,还可以使用任何有用的命令行工具,如ntop,tcpdump, tcptraceroute,httping和古老的ping。
  • TippingPoint IPS系统 – 基本上是一个黑盒子里的 Snort 。 虽然它完全依赖于模式识别,但TippingPoint系统位于networking边缘,并允许我们查找感兴趣的第7层事件(恶意软件,扫描,TCP / IP怪异等)。
  • BlueCoat Packeteer – 这主要是一个QoS和网页过滤设备,但它确实给出了Layer-7入口和出口stream量分解成的高层次视图。 例如:我们的入口stream量的80%是HTTP,这不足为奇,但是Facebook,Pandora,YouTube等有多less呢? 它还提供了每个应用程序的顶级演讲者/顶级听众列表,这也是有趣的信息。
  • Wavemon和带有体面无线网卡的笔记本电脑用于802.11无线监控和故障排除,作为福禄克AirCheck的廉价替代品。 福禄克支持5Ghz(我们的一些无线网桥使用),可以接收非801.11的stream量,并且是周围有用的射频工具,但由于成本的原因,我很难推荐它。

查看VSS Monitoring的产品。 他们有几种不同的串联故障安全产品,用于远程监控networkingstream量。 一旦你让他们看到你的networking和主干,就像在那里一样好。

如果您有能够报告networkingstream量的路由器,请查看networkingstream量处理程序。 在MRTG将提供链路利用率的情况下,Netflow将报告stream经路由器的IP和协议使用情况。 因此,“Suzy在计算使用大量stream量”或“WAP使用的端口具有很高的利用率”时,您可以看到“Suzy在会计中占LANstream量的10%,stream媒体的40%和互联网的50% HTTPstream量。

不幸的是,我没有build议自由stream量聚合器。 在一家networking监控公司试图向我的公司出售解决scheme之后,我确定他们的整个产品都是基于净stream量的,我做了一个笔记来研究它们。 在我开始之前,我们购买了另一个NOC解决scheme,其中还包括一个stream量聚合器。

我一直在使用Wireshark多年。 爱它。

首先,他们是否在抱怨你的本地networking?

文件服务器很慢!

还是他们抱怨远程网站?

脸书很慢! 我不能做我的工作!

如果是前者,那么我将从文件服务器开始,向后工作。 首先检查文件服务器,是不是普通的利用率? 检查用户stream量的接口。 它挂钩了吗? 是否启用自动协商? 它是否启用两端…

如果在那里一切正常,并且服务器没有任何不适当的负载,请尝试在用户和服务器之间的path中的路由器和交换机。 他们超载了吗? 自动忽略启用? 检查接口计数器是否有错误。

如果这似乎没有错,那么问题可能在用户工作站本地。 它是在不适当的负载? 是否有任何硬件错误(磁盘错误导致固件重试时阻塞)? 他们的机器实际内存低(Firefox的分页困难)?

这通常解决了99%的问题。

根据您处理这些请求的频率,您可能希望颠倒这些步骤的顺序。

或者,如果这是远程站点的问题,在debuggingnetworking之后,用户工作站尝试像mtr这样的工具来检测您和远程站点之间的数据包丢失情况。 如果问题不在您的networking本地,那么您的select可能仅限于与您的提供商一起logging案例,或者等到远程站点解决了它的任何问题。