我们将在数百个(比如说300个)物理x86节点上部署一个hadoop集群。 由于我们没有太多的生产部署经验,所以有一个简单的问题,我们希望听到有经验的人的回应。 什么是最好的实践? 我们应该直接在物理盒子上部署hadoop,还是需要一个虚拟机层(即IaaS云)来pipe理hadoop集群的计算资源。 作出这个决定时应该关心什么?
Hadoop被devise为在裸机硬件上运行。
它打算为您pipe理资源分配。
另一层就是可以避免的开销。
但最佳实践很难说,这取决于很多因素。
你应该阅读http://wiki.apache.org/hadoop/Virtual%20Hadoop并做出决定。
这解决了在虚拟环境中运行Hadoop的原因,并解释了为什么有些人仍然可能想要这样做。