我们有一个在Amazon AWS上托pipe的Web应用程序和API,具有三个环境 – 开发(dev),testing/分期(uat)和实时。 每个环境都有一个负载均衡器,两个EC2实例和一个RDS数据库。 我们对AWS比较陌生,在某种程度上我们正在学习,但总的来说,它对我们来说工作得非常好。
星期三上午8点25分,我们发现在开发环境中的响应时间突然增加:

这三个环境运行相同的代码和相同的数据模式。 networking活动,CPU利用率,磁盘读取/写入活动没有相应的增加。 我们中没有一个人有最明显的想法是什么引起这个突然增加,或者我们可以做什么来解决这个问题。 有几个人说:“哦,这只是你的云计算”,但我不能完全接受,在AWS托pipe只是意味着你的整个网站每一个请求会放慢1秒,无缘无故,你只是耸耸肩,忽略它。
我在这里接下来的步骤是什么? 如何解决这个问题呢?
下一步 – 联系AWS支持(打开一张票)并解释问题 – 请他们查看ELB的日志。 他们可能会说没有什么不对,但如果问题是可以重复的,那么你很幸运 – 你可以在事件发生时要求现场支持。