我正在处理教会中一个小型networking中令人讨厌的情况,这个networking是我主要的志愿者ITpipe理员,大概有20台电脑。
我们在千兆互联网的家乡查塔努加,所以我们有很多的带宽(100MB的连接)。
根据pfSense仪表板,pfSense硬件是:
Intel(R) Atom(TM) CPU D525 @ 1.80GHz 4 CPUs
NIC(WAN + LAN)都是千兆端口。 这东西有2GB内存。
我们有一个计算机实验室/课后辅导计划,所以我使用pfSense进行Squid和Squidguard的内容过滤。
一个半星期前,我不知道,另一个IT人员进来,重新安排了一大堆IT设备,把一些东西挂在networking壁橱里,而没有先和我说话。
那恰好是同一个周末,一场大风暴吹响了整个城镇。
从那以后,互联网一直很斑点。 互联网开始放缓,并一直放缓,直到无法使用,然后大多数(如果不是全部)的人报告说,它彻头彻尾的破碎,没有进入外部世界。
由于我不是经常在现场,所以在实际发生的时候,我很难真正解决问题。 这个解决scheme(我不是很喜欢这个解决scheme,但是它可以胜任这个工作)一直是从networking设备(Ubiquiti接入点,Cisco SG-100和ISP设备中的pfSense + 1) ,把所有的东西都插回去,一切都恢复正常。
然而,有时候我可以在现场,我注意到,当互联网出现故障(10.0.0.1)时,我无法ping通网关(pfSense),而我能够ping其他内部设备,例如位于10.0.0.2的打印机。
回顾pfSense仪表板,我从来没有看到stream量变得饱和。 我们有一个100MB的连接,所以有足够的带宽。 现场没有服务器和高带宽应用程序。
对我来说,症状听起来就像生成树问题(我们没有任何智能交换机,尽pipe我在networking的核心部署了一台Cisco SG-100。
我检查了我们所有的交换机(我们在整个build筑物中只有3个 – 没有8个以上的端口),并且跟踪了所有的电缆,确保没有物理环路,并确保交换机没有互相连接多次。
于是我将pfSense硬件从2.1.3升级到2.1.5,并升级了Ubiquiti UniFi无线接入点的全部4个固件。 我也没有连续运行无线控制器,所以我将软件安装到几乎总是开着的员工个人计算机上,以便控制器保持存在。
(如果你对Ubiquiti UniFi有所了解,你不必让控制器持续运行,但我认为它不会受到伤害)
当互联网速度很慢的时候,我在今天早些时候从自己的PC(Ubuntu)上运行了很多的ping命令,但是我看到了很多数据包丢失。 我注意到,因为我会ping一个特定的外部IP地址,一开始就会有很多数据包丢失,但是我让ping运行的时间越长,ping响应就越快(并且更加一致/可靠) 。
回顾防火墙上的代理filterconfiguration,我注意到在代理服务器部分的高速cachingpipe理中,内存高速caching大小是32MB,而RAM中的最大对象大小被设置为64MB。 意识到这可能会导致一个问题,我增加了高达256MB的内存caching大小,并完全closures了硬盘caching。
我希望这会有所帮助,但是我们会在接下来的24-48小时内收看networking。
(更新:这似乎没有帮助,离开5分钟后,我接到一个电话,说我的networking出现故障,于是我回来,用临时的Cisco Linksys路由器换掉了pfSense设备,我们将看到发生)。
是否有任何其他的build议或事情,我应该研究解决这个正在进行的问题? 我以为我的确有一个想法,那就是那个没有先问我的networking设备的人就可能捏住一根电缆。 我把pfSense设备上的电缆换成了局域网,但是这并没有帮助。 另一个想法是,由于风暴,可能会出现某种程度的波动,但networking中的一切都在APC电涌保护器后面。 无论如何,那是什么时候开始的问题。
我有WireShark,但我不完全确定在数据包捕获中要查找什么。 也许一些关于如何处理数据包捕获的指针也会有所帮助。