Hadoop的硬盘select

我们正在评估设置一个大的hadoop集群的选项。 现在我们可以从这三个设置中进行select:

  • 带有12x 1TB磁盘的300x服务器
  • 带有12x 2TB磁盘的150x服务器
  • 带有12x 3TB磁盘的100x服务器

其他服务器规格是相同的。 你会select什么,更重要的是,为什么?

最好的问候,罗宾

你有更多的服务器,你有更多的马力。 他们都具有相同的能力,但是只有知道该集群将要完成什么的人才能在这些选项之间作出决定。

编辑:我在这包括磁盘IO马力。 您拥有的磁盘越多,可以推送的随机IO数量就越多,以及在顺序工作负载下可以推送的更高的MB / s。 每个主轴(磁盘)都会为集成性能添加线性数量。