我有一个与DataDog集成的现有AWS基础架构,负责监视各种度量标准,例如SQS队列,ELB等。
我想设置一些网站和API的健康检查。 据我所知,可以通过AWS ELB健康检查来完成。 但是,我想模拟最终用户的体验,以便请求从外部发送,并通过ELB进行并应用程序。 另外,并不是所有的应用程序目前都有ELB。 我决定使用DataDog的HTTP检查。 问题是,我应该有一个单独的EC2实例只是为了安装代理? 我当然不希望将代理安装在网站所在的同一台机器上,因为它会遗漏各种networking问题。
我也考虑过使用DataDog进行监控的Route 53健康检查,但是我不认为它会很快,因为DataDog和AWS之间的通信通常比DataDog的代理报告延迟。
更新:现在我已经决定使用Route 53运行状况检查和CloudWatch警报。 DataDog负责在某个警报触发时发送通知。 如预期的那样,警报和DataDog的反应之间有一些延迟,但事实certificate这是可以接受的。
对于更深入,更严肃的分析,我也考虑过新遗物和应用洞察。 他们都似乎提供了所需的健康检查,虽然New Relic相当昂贵,Application Insights与Azue更好地整合。
我build议为此使用第三方服务。 因为我们已经有了新的东西,所以我们使用了包含的可用性监视function来ping一些我们的API设置点。 它应该与datadog很好地结合。 只是为了平检查newrelic可能太昂贵,但也有其他的选项,如https://www.host-tracker.com/ ,可以最大限度地使用他们的API集成。