如何诊断间歇性连接问题

在工作中,我们正在与互联网遭受一些间歇性故障。 这performance为我们的桌面计算机没有能够在外部进行包括到IP地址的任何请求几分钟。 我们指责我们的服务提供商,但最偶然的中断,我通过SSH连接到我们的服务器之一,并意识到它能够作出外部的ping请求。

我们的networking基础设施如下。

 VDSL GATEWAY
      |
      |
      |
无线路由器 -  -  -  -  -  -  -  -  -  -  -  -  -  -  -  -  -  -  -  -  - -
      |  |  |
      |  |  |
活动目录服务器SERVER开关
                                                       |  |  |  |  |
                                                      台式电脑

VDSL网关通过无线路由器上的PPPoE进行configuration。

事实

  • 在上次停机期间,上面标记的SERVER能够继续提出请求,它能够继续ping谷歌。 (应该暗示VDSL网关和无线路由器正在工作)
  • 所有台式计算机失去连接,但我可以向SERVER发出请求,这意味着交换机正常工作。
  • 停电只能持续很短的时间。
  • 无线设备也失去连接,表明路由器上的问题在无线路由器或上游。
  • 所有机器都通过Active Directory服务器获得DNS。 但是直接IP请求发生问题,所以DNS应该工作。
  • SERVER正在运行CENTOS
  • 台式机是Windows(主要),苹果Mac和UBUNTU的一个组合)
  • 当networking出现故障时,我们会失去VPN连接。

我目前没有任何跟踪路由数据。

如何诊断networking上出现的问题? 理想情况下,我希望能够至less从我的机器ubuntu和centos安装来准确监视发生问题的时间(loginping请求?)。 也许在外部ping失败时运行traceroute。

networking被configuration为使用IPv4。 networking设置将无线路由器设置为公共网关。

当前条目 – 服务器通过不同的路线。 – 我很生气,情况没有意义。

其他需要注意的是,所有台式机都通过交换机通过无线路由器上的一个以太网套接字连接。

你有没有检查服务器上的dmesg。 这听起来像你可能有你的内部网卡上的硬件/驱动程序问题,或者像连接跟踪表变得太满了。

我也看到了由于configuration错误或计算机上的恶意软件导致internatlnetworking泛滥的情况。 如果开关上的灯像一棵疯狂的圣诞树闪烁 – 这可能是你的问题。

iptraf是一个非常有用的安装和监视每个接口。 从事物的声音,你应该监视内部接口,看看活动的样子。 这可能会指向你正确的方向。

祝你好运。