Solr在单个专用服务器上的容量

我有一个大的Amazon EC2 Ubuntu实例上运行的Solr。 在这个EC2实例上还有很多其他Rails服务正在运行。 今天,索尔ch咽,不得不重新启动。 这里是一些更多的信息:

  • 文件数量:+5百万
  • 吞吐量:+ 100 rpm
  • 平均。 响应时间:60毫秒(随着我们添加更多文档而变慢)
  • 最慢的响应时间:2-3秒(这直到最近才发生 – 也许是因为Solr没有处理数据量)
  • 运行的Solr实例的数量:1
  • 在专用服务器上:NO – 它与我们正在运行的其他Rails服务共享。

我的问题是:如果我将Solr移动到一个专用的大型Amazon实例并完美configuration一切,那么我可以期望的最高性能是什么。 吞吐量和最大数量的索引文件?

提前致谢

达伦

TL / DNR版本:

回答这个问题的唯一方法就是让你设置它并进行基准testing。

长版本:

这个问题是不可能的,原因如下:

  • 您可以购买多个服务器级别的EC2
  • EC2是dynamic的(“E”是“Elastic”),所以你的速度会不时变化
  • networking的性质,特别是在广域网上的性质将会显着影响性能
  • “完美configuration一切”是什么意思?
  • Ubuntu被devise成易于使用的,因此放弃了一些性能,所以试图将所有“完美”调整为可能被认为是没有意义的

即使你把最不可思议的部分(即云服务器代替局域网上的物理盒子)拿走了,解决你的问题的唯一方法就是用你的 SOLR实例和DB加载一个和你的服务器完全一样的服务器,然后进行基准testing。