有没有硬件级别的良好指南来支持ElasticSearch? build议Lucene或Solr是一个很好的开始? 我们正在研究开始部署
然后缩放大约10倍,以
这是一个奇怪的使用案例,查询将以千次/天的速度进行,但响应时间需要保持足够低,以便使用Ajaxy Web应用程序获得良好体验。
有很多因素可以发挥作用,所以我不认为有很多一般的指导方针。
您应该进行较小规模的评估,可能是初始数据集的1/5,以查看在设置时如何预测索引和search负载时的情况。 这将确保您了解您的数据在search引擎中实际消耗了多less空间。 对于弹性search,取决于是否存储源json以及字段如何分析以及是否存储。
EC2可以是一个合理的方法来评估弹性search没有大的h / w支出。
对于基于群集的软件,如elasticsearch,在保持群集较小和较大的群集之间进行权衡。 一个大集群是很好的,因为当你失去一台服务器,更less的数据需要重新分配。 较小的群集消耗较less的能量并且更易于维护。
由于所有的索引都被复制,我们运行一个集群,索引大小为300GB x 2,总共有3500万个文档。 为了支持这个和大量的search,我们有4个节点,每个节点有24个核心,48GB的RAM和1TB的存储10K的磁盘10。 我们最近增加了磁盘大小,以确保我们拥有更多的空间。
对于你的情况,我会build议更多的RAM和更多的磁盘。 你可以用这个search量在CPU上省钱。
低search量实际上损害了性能,因为高速caching(所使用的s / w内部和操作系统磁盘)将不会很好地加热。
希望这有助于保罗