elasticsearch如何压缩数据?

我正在寻求范围弹性search概念validation所需的服务器。

最终,我的问题是这样的:

给定1GB的elasticsearch索引的json文本,弹性search可以占用多less磁盘空间?

显然有很多变数,但我要做的是数量级。 100MB? 100GB?

我知道elasticsearch会执行压缩( http://www.elasticsearch.org/guide/reference/index-modules/store/ ),但是我不知道索引和其他结构占用了什么样的脚印。

轶事答案是可以接受的,但也请让我知道你使用的是什么版本。

答案是:这取决于。

在Elasticsearch上工作的Adrien Grand的博客文章从Lucene的angular度做了一些基准testing。 看起来他正在获得两倍的提高。

他还提到了LUCENE-4226 ,其中一些基本的压缩工作已经完成。 列出了几个基准,比较各种testing的压缩algorithm。

同样,基于这个Elasticsearch 0.19.5发布公告 ,看来商店级压缩默认为LZF,而Snappy将来还会有一段时间。 进一步观察表明,快速的实验支持出现在0.19.9