我为我的EC2实例有一个CPUUtilization警报设置。 警报的设置是:
CPUUtilization >= 95% for 15 consecutive periods of 1 minute (15mins total)
即使实例未进入定义的警报状态,我们仍然收到警报电子邮件。
我和我收到的电子邮件报警解释:
您收到此电子邮件是因为您的Amazon CloudWatch警报…已进入警报状态,因为“阈值交叉: 3个数据点大于或等于阈值(95.0)”。最近的数据点:[99.466,98.45] .. 。
3个数据点? 我的理解是,如果15个数据点大于95%,那么我设置15个连续的1分钟的时间应该只能提醒一下。
我误解了电子邮件的文字吗? 我的闹铃设置是否与某些内容相冲突?
您的EC2实例必须启用以1分钟的时间间隔进行监视。 如果您尚未启用对EC2实例的详细监控 ,那么您将以5分钟的时间间隔收集数据。 连续3分钟的时间间隔为15分钟。
我不确定,但是在查看了我自己的Cloudwatch警报并在控制台中播放了一个新警报后,在这种情况下,警报状态触发器基于分钟而不是周期 – 我们只是定义在闹钟创build时间段内的分钟数。 这对我来说似乎是很明智的,否则,如果详细的(1分钟)监视被禁用,你的闹钟将永远无法进入闹钟状态。
关于详细的监测:如果禁用,我会打开这个案例。 如果您正在使用基本(5分钟)监控,则3个数据点不一定表示连续15分钟的CPU使用率> = 95%。 这意味着在数据采样的时候CPU利用率> 95%,连续3次采样。
即使您没有启用详细的监控,但在4分钟内没有数据,亚马逊也允许您在1分钟内创build警报。 如果看到CloudWatch控制台,则警报应处于“ Insufficient状态4分钟,并且每5分钟更换一次“ OK 。 所以如果你把时间改为5分钟,或者启用详细的监控,你会很好。
CloudWatch期间:
这取决于你select什么types的期间,而不是它的价值。
如果select分钟数,则连续1个周期为1分钟,连续10个周期为10分钟。
如果select小时,则连续1个周期为1小时,连续10个周期为10个小时。
如果select天数,则连续1个周期为1天,连续10个周期为10天。
在你的情况下,你select15分钟,然后连续15个时间段,但有数据可用,每5分钟,因此它只有3个数据点。