我请求了Amazon EC2实例,有时会挂起。 什么可能是服务器挂起的可能原因? 在挂起之前是否有可以完成或检测到的东西? 有没有什么好的开源监控工具可以检测到这一点,并采取预防措施。
系统pipe理员如何处理这个问题?
谢谢巴拉
你的意思是要求挂断,而不是稍后?
有两个选项。 一个是,亚马逊的呼叫只是失败 – 我已经看到统计声称约2%的所有亚马逊API请求失败,“没有很好的理由”,你应该总是有一个编码的事情重试类。
另一个是当你的实例启动的时候你正在做一些聪明的事情,那就是在启动周期中导致实际的Linux操作系统挂起。 就像添加了一个init脚本来插入一些dynamic的DNS或者其他任何依赖外部依赖的东西,导致它被吓坏了。 我会在启动过程中晚些时候移动任何自定义的东西,也许会得到一些远程系统日志,以查看在操作系统级别是否有什么问题。
不过,我倾向于把钱放在前者上。
继Ernest的回答之后,通常可以通过检查实例启动时的控制台输出来了解发生了什么情况。 如果您通过AWSpipe理控制台启动您的实例,或者使用EC2命令行工具中的ec2-get-console-output命令,则这可作为链接提供。