Hadoop Hive,Impala,Pig等 – SQL访问Hadoop?

看来Hive,Impala,Pig和其他所有人都可以对存储在Hadoop集群上的数据提供类似于SQL或SQL的访问。 他们似乎都支持HDFS,S3和其他forms。

那么为什么通过SQL访问Hadoop信息有很多不同的方式,它们又有什么不同,它们的性能如何呢?

我们有很多不同的版本,因为所有的项目都是同时启动的,原因大致相同? 如果是这样,知道其中不止一个人有好处吗?

我发现了一些试图解释差异的文章(例如,用SQL查询hadoop和在Hadoop上select正确的SQL的 10种方法 ,但大多数情况下只是列出了function。