networking监控解决scheme

我有一个我需要监视的大型分布式系统。

背景:

我的系统由两台服务器组成,集中和控制系统。 每个服务器连接到一组设备(一些自定义types的RF控制器,对我的问题无关紧要),每台设备连接到一台networking交换机,最终所有设备都与服务器通话,服务器和设备之间的协议是UDP,通常这个数据包很小,但是确实有很多数据包。 networking也有些复杂,并在物理上大面积部署。 我将有150-300个这样的设备,每个设备每秒产生多达100多个数据包,还有几个networking交换机,可能在2个不同的子网上。

我正在寻找一些解决scheme,让我能够监控所有这些乱七八糟的事情,发送多less包,在哪里,如何通过networking,带宽利用率,吞吐量等等。 你会推荐什么来达到这个目的?

顺便和窗户打好是一个要求。

看看SolarWinds http://www.solarwinds.com/

我推荐Zabbix 。 这将有助于监视您的服务器和应用程序。

也许是Ganglia

为什么 – >可扩展性和高性能

许多监控解决scheme,如已经提到的解决scheme,可能会为你做这个,但是如果你想要不同的东西考虑使用ntop。 http://www.ntop.org这样做的好处是,应该更容易设置,而不是一个完整的监控系统,它将是无代理的。 但是它有一些先决条件。

在您的networking交换机上启用要监视的设备的端口镜像。 http://en.wikipedia.org/wiki/Port_mirroring 。 显然你需要一个开关来支持这个。

你还需要一个运行ntop的linux系统,这个系统非常易于安装和运行。 Linux的盒子将需要2个网卡,一个用于networking访问,一个用于监控stream量。

按照正常的方式configurationlinux盒子并安装ntop并configuration它使用你的辅助网卡。 将辅助卡插入networking交换机的端口镜像中。

随着这一点,你现在有一个网站,可以显示您列出的所有信息,无论主机/设备types。 这是查看您的本地networking中发生了什么的一个非常好的方法。

这里是ntop的一小步一步。 http://www.howtoforge.com/network_monitoring_with_ntop

虽然也许这完全不是你想要的,但我使用这个工具很多,而且与其他答案不同。

我第二个Zabbix的build议。 你刚才说过,它必须和Windows一起玩,而不是在Windows上运行。 Zabbix服务器运行在* nix服务器上,通常是Linux。 它的监视和绘图function非常强大。 使用正确的SNMP项目,您可以轻松地监视您的交换机,并且您应该使用Zabbix代理。

如果你想收集stream量数据,比如数据包在networking上stream动,那么像Zabbix这样的工具就会很快下降。 NTop是这个领域最好的开源工具之一。 NTop将从交换机接收sFlow和rMon数据,然后生成一些关于数据stream的dynamic报告。 然而,NTop不是一个系统监控工具,但它可以通过stream量数据获得带宽,但是它不能在交换机上以每个端口为基础给你,Zabbix可以做到这一点。

你的交换机是否支持sFlow协议? 快速查找的方法是检查sFlow.org上的networking设备列表。 您还可以使用sFlow监视Windows服务器的性能,只需安装Host sFlow代理即可。 使用sFlow的优点是将networking和系统监控任务的“混乱” 整合到一个集成系统中 。

sFlowTrend是一个免费的sFlow分析仪,应该给你你想要的可见性。 或者,这个线程中已经提到的一些工具支持sFlow(ntop,Ganglia,Solarwinds)。 请参阅sFlow.org上的sFlow Collectors列表以获取完整的选项列表。

那里有很多select。 已经使用了Zabbix,ZenOSS,Nagios等等。 与SNMP结合使用时,可以收集和使用大量的信息,以便跟踪您的networking,使其超出您所要求的范围。

我使用Zabbix与任何types的代理(Zabbix代理,SNMP(陷阱),SSH,简单检查)来监视任何types的设备(Windows,Linux,路由器,防火墙,交换机),收集数据,任何复杂的情况。 非常成功,非常稳定,尤其是使用pgsql。