Intereting Posts

良好的支持*自动更新的nix 为什么使用SSHFS非常缓慢/无目录caching？从Windows XP客户端Windows 2003networking共享上删除的文件在Puppet模块中放置variables 用`find`来删除如何知道什么memcached节点来查找其数据？在Synology 211 NAS和Ubuntu客户端上共享NFS文件时遇到问题服务器configurationGithub安全注意事项？由于PHP-FPM侦听队列，站点变得不可访问，CPU触及100％亚马逊EC2现货价格和按需价格混淆，需要帮助只有在vmware桥接连接的Ubuntu服务器获取ipv6 OS X地址不可用 – 如何打开此端口？在apache vps的子域上运行docker 哪个工具：图表业务服务及其技术依赖关系 Ubuntu 14.04.2 LTS – RSysLog 8.8.0 – omusrmsg无法正常工作

Amazon EC2 EBS存储可靠性

我们在Amazon EC2上运行了大量Ubuntu实例，在过去的两个月里，我们发现其中一些实例没有响应且无法访问。没有SSH，没有ping响应等最终重新启动这些实例帮助作为最后的手段。

所有受影响的实例都是基于EBS的。没有迹象表明原木失败的原因。我们一直怀疑，也许这些实例可能以某种方式放弃连接到他们的EBS卷。

我的问题是：

这是甚至可能的（我的意思是：一个实例失去连接到它的EBS卷）？
我怎么去debugging这个，并确保这是事实？
最重要的是：我如何防止这个？

截至目前，EBS是您在AWS上最可靠的选项。它不仅更好，而且还可以轻松拍摄快照并重新连接到另一个实例。我们有非常大的Ec2实例，这是基于EBS的媒体网站使用，并没有像这样的问题。除此之外，亚马逊保证99.95％的正常运行时间为这项服务，并会给退款incase它下降。

回答你的问题。

这是不太可能的，除非你的实例健康由于某种原因不好。但过去曾有类似的问题报告，IOPS不佳。看到
检查“读写IO”与“队列中的未决IO”。所以如果在队列中有待处理的IO时你有0 IO，那么你有一个问题。请参阅SLA。
检查实例的健康状况+ EBS IOP的健康状况。您可以使用cloudwatch进行一些扩展。检查这个链接。