我有1个实例。 如果3分钟的延迟时间超过1秒,则会增加另一个实例。
而这里出现的问题是:50分钟后(因缩放冷却)这个二次终止。 而且,如果负载仍然很高,延迟会跳回到1秒以上。
但是因为缩小冷却时间,不能再加一个新的!
是否可以单独设置和降低冷静? 或另一个build议来解决这个问题?
冷却时间减less不会有帮助,情况会更加频繁地死亡,所以应用停机时间依然很大。
我认为你应该更好地设置较短的冷却时间,并使用Cloudwatch阈值来根据你的需要或多或less的敏感。 通常情况下,冷却时间应该是允许自动缩放的时间的最小时间,以允许cloudwatch根据新的容量填充自己,并允许它更好地做出新的Autoscaling决策。 对于大多数Web应用程序10-15分钟应该是足够的。
现在做出决定的基本经验法则是:快速放大,慢慢放大。 您可以根据您的阈值缩放几个1分钟的值,而仅从每15分钟的多个度量标准缩小。 例如,如果连续3个1分钟CPU> 50%的事件发生,则可以提供多于50%的容量,并且在发生连续4个15分钟CPU <25%的值时分解单个实例。