我有一个非盈利的小型非盈利组织,我在Netgear交换机上提供了一个集线器和分支光纤networking。 它们具有T1和DSL连接,由一个简单的VoIP系统运行的VLAN隔开。 有奇怪的事情发生,并定期networking变慢然后堵塞。 骑自行车的主要设备的电源恢复function,直到下一次(通常几天后)。 networking实际上相当简单(服务大约15个用户),他们没有一个专门的IT人员,尽pipe技术上更有技术头脑的一般工作人员是大多数平凡的IT人员。
该组织位于农村,难以find当地的支持,有足够的知识深度来诊断问题(build议他们系统地取代所有的设备,直到问题消失不是一个诊断恕我直言)。
所有的交换机都被pipe理,我们可以build立一个数据包嗅探机,直接插入一个端口设置进行监控。 认为一个远程login的networking专家有可能做侦探工作来找出问题的根源是否现实呢?
假设它是可行的,任何方向寻找大师网站也将不胜感激。 此外,如果任何networking爱好者阅读这个以合理的价格上涨一些月光,请评论。
认为一个远程login的networking专家有可能做侦探工作来找出问题的根源是否现实呢?
大多数人必须这样做是理所当然的。 几乎没有哪个器官在每个地方都有这方面的专业知识,甚至参观也不容易解决问题,因为问题往往是间歇性的或不可预测的。
例如,监视交换机端口和主机上的stream量(例如字节input/输出,数据包input/输出数量;广播和多播input/输出,错误input/输出)可以给出正常行为的第一个概述以及故障状态。 典型的时间间隔是每5分钟一次,并在较长时间内汇总,理想情况下显示在网页上。 数据需要存储在本地以及远程,以防在进行故障时访问丢失。
SNMP警报对收集很有用。
除了那些通往基于BSD或GNU / Linux的机器(通常连接到本地开关上的一个或多个跨接端口)的机器的networking走线是有用的,但是如果不是狭窄地过滤,则可能是巨大的。 可能需要多个来源(例如,来往/来自本地服务器的stream量;去往/来自WAN连接的stream量)。 如果可以同时采用多个轨迹,这将有所帮助。
所有这些都可以通过远程查看和解释,但是需要对所检查的networking进行合理的理解,并且一些数据量(特别是等待出现故障的原始痕迹或痕迹)可能是巨大的。
在允许第三方访问networking或将您的组织的控制权发送出去之前,需要进行风险评估。 完整的networking跟踪允许重build任何未encryption的内容。 即使数据被encryption,并且跟踪排除了大部分内容,仍然可以使用信号源和接收器完整logging卷。 例如,它也可能包括访问的网站和页面。 encryption通过邮件发送的跟踪信息的磁盘将是一个最小的保障,你会希望相信这些去谁的信任。 被授予访问权限的外部方可能需要设备密码:确保知道可以更改哪些设备密码,并考虑给具有外部访问权限的审核设备。 如果可能的话,在线外部访问应该在安全通道上(例如使用ssh)。
我会开始监测。 如果你有间歇性的问题不能自行消失,但重新启动解决它,请检查您的资源水平。 这是一个标志,/某些/正在消耗您的某种types的免费资源。
您可以设置pipe理交换机通过SNMP监视警报或奇怪行为(如果需要,可以通过SSH临时在其networking上临时安装专用的Linux机器),但要回答您的问题,这取决于您的问题…
当他们遇到networking问题时,是慢还是死?
远程访问是否正常运行速度太慢?
如果networking仍然工作,您可以设置从上面提到的Linux机器访问交换机,看看交换机说什么。 我不知道交换机的全部function,所以我不知道它做了什么或不提醒和login,但这会给你一些接入点来监视networkingstream量以及进入交换机(I'除了22以外,将其设置为从外部访问端口)。
如果可以的话,您可能只需要暂时使用临时设备就可以切换交换机(我知道您所说的关于不作为诊断的内容),但是如果切换到交换机的电源可以解决问题,则可能会非常缩小问题的范围你,但只有当你有能力得到你的临时replace设备的手。
否则,某些东西可能会压倒交换机或路由器。 他们正在运行最新的固件?
许多交换机都支持可能与生产networking完全隔离的“pipe理”networking。 这使您可以通过连接到堡垒主机的调制解调器等带外接口login到您的系统,然后从那里通过pipe理networking连接到所有的networking设备,并从那里执行诊断。
也就是说,这样做通常没有完成,因为它使得您必须支持和testing的networking数量翻倍,但是如果正确完成,可以使远程pipe理与现场人员故障排除一样有效。
设置本地监控(可能是交换机的SNMP),当networking状况不佳时应该继续运行。 在下一次重新启动有问题的设备后,远程login并查看相关时间的日志。
是的,一个好的networking家伙最终应该能够通过这种方式来解决问题,尽pipe这可能比他们本地的系统要慢。