每隔5天左右(包括刚才),我的Web应用程序就会遇到一连串的超时错误。
如果我查看我的SQL实例在CloudWatch中正在执行的操作,则会报告这一点:
可用空间: http ://cl.ly/NBRM
数据库连接: http : //cl.ly/NBLH
写吞吐量: http : //cl.ly/NBFs
阅读IOPS: http : //cl.ly/NBp3
写入IOPS: http : //cl.ly/NAre
队列: http : //cl.ly/NBA7
发生了什么事? 我不相信它的交通相关。 我如何知道发生了什么?
**更新:**每5分钟进行一次增量备份,每日备份在凌晨4点完成(即不会发生这种情况)
谢谢
看起来有一个活跃的高峰,磁盘队列不好,但这一切都取决于你正在使用什么存储,如果这是虚拟化,或由于您可能使用的托pipe基础架构的某种types的SAN,队列深度可以毫无意义 即使这样,你也可以真正处理一些事情,即使这很简单,就像运行sp_WhoIsAtive来查看哪些会话处于活动/暂停状态以及他们在做什么/他们在等待什么一样。 没有足够的信息来做任何预测,I / O的高峰也不应该导致一半体面的I / O子系统的任何问题。