解决pfSense + Ubiquiti UniFi数据包丢失问题（Wireshark也许？）

我正在处理教会中一个小型networking中令人讨厌的情况，这个networking是我主要的志愿者ITpipe理员，大概有20台电脑。

我们在千兆互联网的家乡查塔努加，所以我们有很多的带宽（100MB的连接）。

根据pfSense仪表板，pfSense硬件是：

Intel(R) Atom(TM) CPU D525 @ 1.80GHz 4 CPUs

NIC（WAN + LAN）都是千兆端口。这东西有2GB内存。

我们有一个计算机实验室/课后辅导计划，所以我使用pfSense进行Squid和Squidguard的内容过滤。

一个半星期前，我不知道，另一个IT人员进来，重新安排了一大堆IT设备，把一些东西挂在networking壁橱里，而没有先和我说话。

那恰好是同一个周末，一场大风暴吹响了整个城镇。

从那以后，互联网一直很斑点。互联网开始放缓，并一直放缓，直到无法使用，然后大多数（如果不是全部）的人报告说，它彻头彻尾的破碎，没有进入外部世界。

由于我不是经常在现场，所以在实际发生的时候，我很难真正解决问题。这个解决scheme（我不是很喜欢这个解决scheme，但是它可以胜任这个工作）一直是从networking设备（Ubiquiti接入点，Cisco SG-100和ISP设备中的pfSense + 1），把所有的东西都插回去，一切都恢复正常。

然而，有时候我可以在现场，我注意到，当互联网出现故障（10.0.0.1）时，我无法ping通网关（pfSense），而我能够ping其他内部设备，例如位于10.0.0.2的打印机。

回顾pfSense仪表板，我从来没有看到stream量变得饱和。我们有一个100MB的连接，所以有足够的带宽。现场没有服务器和高带宽应用程序。

对我来说，症状听起来就像生成树问题（我们没有任何智能交换机，尽pipe我在networking的核心部署了一台Cisco SG-100。

我检查了我们所有的交换机（我们在整个build筑物中只有3个 – 没有8个以上的端口），并且跟踪了所有的电缆，确保没有物理环路，并确保交换机没有互相连接多次。

于是我将pfSense硬件从2.1.3升级到2.1.5，并升级了Ubiquiti UniFi无线接入点的全部4个固件。我也没有连续运行无线控制器，所以我将软件安装到几乎总是开着的员工个人计算机上，以便控制器保持存在。

（如果你对Ubiquiti UniFi有所了解，你不必让控制器持续运行，但我认为它不会受到伤害）

当互联网速度很慢的时候，我在今天早些时候从自己的PC（Ubuntu）上运行了很多的ping命令，但是我看到了很多数据包丢失。我注意到，因为我会ping一个特定的外部IP地址，一开始就会有很多数据包丢失，但是我让ping运行的时间越长，ping响应就越快（并且更加一致/可靠）。

回顾防火墙上的代理filterconfiguration，我注意到在代理服务器部分的高速cachingpipe理中，内存高速caching大小是32MB，而RAM中的最大对象大小被设置为64MB。意识到这可能会导致一个问题，我增加了高达256MB的内存caching大小，并完全closures了硬盘caching。

我希望这会有所帮助，但是我们会在接下来的24-48小时内收看networking。

（更新：这似乎没有帮助，离开5分钟后，我接到一个电话，说我的networking出现故障，于是我回来，用临时的Cisco Linksys路由器换掉了pfSense设备，我们将看到发生）。

是否有任何其他的build议或事情，我应该研究解决这个正在进行的问题？我以为我的确有一个想法，那就是那个没有先问我的networking设备的人就可能捏住一根电缆。我把pfSense设备上的电缆换成了局域网，但是这并没有帮助。另一个想法是，由于风暴，可能会出现某种程度的波动，但networking中的一切都在APC电涌保护器后面。无论如何，那是什么时候开始的问题。

我有WireShark，但我不完全确定在数据包捕获中要查找什么。也许一些关于如何处理数据包捕获的指针也会有所帮助。