如何识别和报告不良的RDS硬件

最近,我们终于把我们所有的生产硬件从废弃的默认networking迁移到包括EC2和RDS节点在内的VPC。 除了当我们开始在生产中进行性能testing并且注意到与旧configuration相比显着下降时,一切都进展得很好:至less30-40%的惩罚。

在摸索我们的头脑后,比较软件版本和configuration,我们决定尝试重新生成我们的RDS实例。 最初的目标是将我们的主数据库迁移到不同的AZ来比较苹果和苹果。 当迁移完成后,我们发现性能恢复正常,但是我严重怀疑AZ是我们痛苦的根源。 我无法相信几毫秒(最多)的延迟导致了很多问题,特别是因为不同的查询客户端AZs似乎对性能没有影响。

我怀疑我们是否有一些不好的m3.large RDS硬件,或者是一个特别吵闹的邻居。

  • 任何人都看到这种每个实例的性能差异吗?
  • 任何其他的debugging,我们可以做更好的诊断呢?
  • 在向AWS支持报告这个问题时,1级人员说他们不知道我在内部的硬件。 这真的可以吗? 我没有要求任何身份certificate,但我想认为他们可以为实体团队标记硬件。 任何我能做的不同?

感谢您的任何反馈。

您使用经典的IT解决scheme – closures然后再打开。 这几乎可以肯定地将你引向新的硬件。 如果您担心停机,您可能需要先设置镜像或只读副本。

你不报告,你只是继续前进。