我想监视一些服务器,其中一些服务器可能具有非常不稳定的连接。
这是因为他们位于只有消费者上网的办公地点。
我担心通常的做法 – 每隔一分钟或一段时间进行一次http检查或者其他检查 – 都是短暂的中断,因为它们在检查之间存在,所以可能不会被注意到,但很可能导致缺乏敏感的服务连接或完全中断它们。
事实上,我们在某个地方遇到这样的问题,我已经花了几个小时在电话公司大喊大叫。
我们目前正在评估可能性,以获得一个直接的运营商上行到水平(3)这将是非常可怕的,并会使我的生活更容易。
但为了做到这一点,我需要一些可靠的数字,而不是一些模糊的经验报告。
所以我想要的是一些打开套接字连接的正常运行时间监视器保持打开状态并在相当短的时间间隔(20秒)内请求响应。
当没有响应时,自上次检查以来连接必须中断。
我也将使用这种方法来进行“更好”的服务器监控。
所以我的问题是:
我认为你也许应该在包丢失和延迟方面进行监控。 您可以使用一些工具来不断地ping每秒,另一个工具如Nagios通过电子邮件发送有关超过设定时间的问题。 把这个和一些经过深思熟虑的外部监测点结合起来,可以更全面地了解什么是失败的,什么时候应该得到一些好的指标来对抗你的angular落。
为什么不监视所有的敏感服务,而不仅仅是一个简单的ping。 检查sql,http,ldap(或其他)。 目前大多数监测工具可以做深入的服务检查。 那么你可以不关心连接,只是应用程序运行良好。