我有兴趣监测我们的EC2实例,以确保在必要时扩大规模。 现在我们正在监视闲置的CPU时间作为我们的指标。
我们不测量磁盘I / O,因为我们不是一个非常密集的应用程序。
当我们在数据中心自己的硬件上运行时,我通常还会监视top命令中的“加载”。
我的问题是:
监控共享环境(如EC2)上的“负载”是否有意义? 如果是这样,你如何解释结果?
在EC2上加载测量和解释相同,在任何Linux系统上。 虚拟机环境不会影响该指标。
也就是说,CPU空闲可能是一个比负载更好的度量标准,用于衡量服务器为了扩展目的而有多忙。
您可能需要在负载平衡器上添加监视,以检查健康实例和5xx状态码。
当我们的服务器超载的时候,客户端开始得到“503服务不可用”响应,我们启动一个额外的服务器,然后过载的服务器恢复。