有些困惑,因为我的问题,使简单:
“大型云提供商使用什么types的存储,为什么?
据我所知,无论在典型的数据中心还是云端,我都找不到任何官方的存储networking差异,所有的云提供商都使用与典型的数据中心不同的DAS。
即使DAS比SAN或NAS还有许多缺点,我想了解为什么使用DAS的云存储或应用的细节。
任何资源或描述将不胜感激,让我清楚。
编辑:当阅读“大规模云build设的networking挑战和合作方法”一文时,David Bernstein和Erik Ludvigson(思科)提到,
奇怪的是,我们没有看到使用NAS或SAN的主要提供商的云。 典型的云架构使用DAS,这不是典型的数据中心存储方法。
但是在这里有一个冲突:在我看来,也在本文稍后部分,云应该使用SAN或NAS,因为当虚拟机移动到另一台服务器但是仍然需要从原始服务器访问存储时,DAS是不合适的。
影响云selectDAS,NAS或SAN的其他原因是什么? 大型云提供商使用什么样的存储,为什么?
问题澄清后,这个答案已经被编辑了。
影响云selectDAS的其他原因是什么?
其中“DAS”表示直接连接存储,即SATA或SAS硬盘驱动器。
云供应商都使用DAS,因为它提供了数量级的性价比改进。 这是水平缩放的情况。
总之,SATA硬盘驱动器和SATA控制器是便宜的商品。 他们是大众市场产品,定价非常低。 通过用便宜的SATA驱动器构build大量便宜的个人电脑,谷歌,亚马逊和其他公司以非常低的价格获得了大量的产品。 然后,他们将自己的软件层添加到顶部。 他们的软件为性能和可靠性进行多服务器复制,在硬件故障后监控,重新平衡复制等。
您可以看看MogileFS,作为Google,Amazon和其他用于存储的软件的简单代表。 当然,这是一个不同的实现,但它与大型系统共享许多相同的devise目标和解决scheme。 如果你想,这里是一个更多地了解GoogleFS的跳跃点。
在本文稍后的部分中,云应该使用SAN或NAS,因为当VM移动到另一个服务器时,DAS不适用
没有使用SAN的原因有两个。
1)价格。 SAN的规模非常昂贵。 虽然它们可能是技术上“最好”的解决scheme,但由于成本的原因,它们通常不能用于大规模安装。
2)CAP定理 Eric Brewer的CAP定理表明,在非常大的范围内,在保持可接受的可靠性,容错性和性能的同时,不能保持强一致性。 SAN是为了使硬件保持一致性的尝试。 这对于5.000服务器的安装可能很好,但是从来没有certificate可以用于Google的250.000+服务器。
结果:到目前为止,云计算供应商已经select将维护服务器状态的复杂性推向应用程序开发人员。 当前的云产品不能为每个虚拟机提供一致的状态。 应用程序服务器(虚拟机)可能会随时崩溃并丢失其本地数据。
然后,每个供应商都有自己的持久性存储实现,您应该使用这些实现重要的数据。 亚马逊的产品是很好的例子。 MySQL , SimpleDB和简单存储服务 。 这些产品本身反映了CAP定理 – MySQL实例具有很强的一致性,但是可扩展性有限。 SimpleDB和S3的规模很大,但最终只是一致的。
如果您使用DAS,则可用性是您的问题
如果他们使用DAS,则可用性是他们的问题。 如果他们有什么好处,他们会使用几个抽象层来确保他们的问题不会成为你的问题。 而不是被挂在他们如何select在自己的数据中心中安装磁盘,问题是他们在SLA中保证的可用性是否足以满足您的需求。 噢,房间里真正的大象,如果他们停业,你会怎么做(不太可能对某些供应商来说,但你应该考虑这个),如果你在本地使用这些数据,你的networking连接是什么不可用 – 后者比他们select直接导致停机的DAS更可能。
虽然我没有在DAS和SAN / NAS上做出答案,但在寻找存储解决scheme时还有许多事情需要考虑。
数据量? 如果我们考虑Gb,那么有备份的NAS可以完成这项工作。 如果有terrabytes的数据,价格上涨非常快。
我认为价格是主要因素……如果你有一个SAN,你需要:
而且,你根本没有冗余。 如果您有权访问数据中心,情况可能会有所不同。
另一件要考虑的是可访问性。 你正在归档? 如果是这样,可访问性不是问题,那么您每天/每周/每月的几次存档到您的存储解决scheme。
另一方面,如果您有需要不断访问的数据,则很快就会发现带宽和硬件限制(如I / O)的瓶颈。 但另一方面,如果您的数据传输量很大,那么在线存储解决scheme很可能会花费很多。
ROI(投资回报率)是所有在线存储解决scheme供应商所宣传的,当然,这通常是正确的,具体取决于使用情况。
祝你好运。
(只有意见,而且概括性很强)
不同之处在于您正在查看的抽象层(通常)。
SAN / NAS通常为您提供卷,您可以在其上安装文件系统。 这种方法对于terminal系统的价值在于你已经外包了物理硬件的细节(例如RAID级别,物理位置等)。
相比之下,云存储通常为您提供一个文件系统的接口。 这样做的好处是你可以免费获得更高级的function(例如,Dropbox可以自动对每个文件进行版本控制,透明)。