服务器VS桌面与托pipeRAM密集,低stream量应用服务响应API

我们是一家初创公司,希望将我们的语义search系统用于简历的生活。 系统需要通过运行大小为25GB左右的倒排索引数据(这些不是倒排文本索引,而是sorting相关的技能索引,因此需要计算和“从头开发”而不是从头开发)来提供对于恢复search的API查询的响应使用像lucene等库)。 该应用程序是用python编码的,我们所用的硬件将需要提供以下内容:

一个。 32 GB的RAM,以便我们可以将25 GB的数据保存在内存中,以便实时处理请求。 湾 能够处理3-4个并发连接。 C。 能够每天处理1000-1500个API调用。 每个API查询都会导致search计算发生在内存中的数据上,并根据一定的匹配和sortingalgorithm返回结果。 d。 正常运行时间要求不是很严格。 由于我们将在beta阶段进行一段时间(比如说6个月),如果能够让我们用更便宜的解决scheme进行pipe理,我们可以承受高达95%的正常运行时间。

需要的投入是否应该去1.服务器系统(主要缺点 – 成本高,现金对初创公司来说是最重要的)2.桌面解决scheme,支持32 GB的板(在印度我们不能find1主要的收益 – 成本主要缺点 – 服务器一致性较差)3.托pipe解决scheme(主要缺点 – 专用32 GB服务器的成本)。

提前致谢。

这取决于你的启动有多less现金。

为什么不使用Amazon EC2实例呢? 它会符合你的规格吗?

如果你想购买你自己的服务器,你可以得到一个戴尔R410或戴尔R510,将符合这一要求。

你也想考虑如果你成功,你将如何扩大规模

一些粗略的数字和评论。 请注意,价值来自北美,我不知道如何比较印度的任何事情。

  • 每月租用32GB的专用服务器可能会在700美元/月的范围内。
  • 具有34GB内存的高内存双额外大型实例Amazon EC2实例的价格为700美元/月,100%利用率,但不包括任何存储/带宽。 你可以玩亚马逊计算器 ,更熟悉亚马逊服务的人可以告诉你你做什么,不需要什么。
  • 购买32GB内存的服务器将开始大约3000美元,但这不包括任何托pipe/带宽。
  • 你有多确定你需要一个25GB的索引全部在RAM中? 你看过优化索引大小吗? 您是否将指数performance与各种RAM大小进行了基准比较? 你可能能够以较小的内存容量获得性能,而且成本相对较低。
  • 考虑扩大,而不是。 而不是一个大型机器看在多个小型机器上分配索引。 当您考虑到将来可能扩展您的系统时,这一点尤为重要。 你的索引现在是25GB,但如果在几年内它的100GB,你将如何有效地扩展它?

如果不了解更多有关应用程序/业务的信息,我将从一个小型/基本的专用服务器开始,每月租用一个或更小的Amazon EC2实例,特别是如果您担心在一台较大的机器上花费几千美元。 看看这个小型服务器是如何工作的,或者看不见,看看扩展是否是一种select。 如果是根据需要添加更多的小型服务器/实例以达到性能/预算目标。