在高插入MSSQL数据库上进行大规模全文search的想法

我有一个相当大的MSSQL数据库,每天有大约600万行的表格和大约5万个插入表。 我开始努力的事情之一是全文search,因为我要求表中的某一列是全文索引。

我最初使用MSSQL 2008 R2内置的全文在数据库引擎的同一台主机上运行,​​但最近我遇到了性能和可靠性问题。 我经常看到CPU与100%挂钩,并假设这是运行人口的全文索引。 我也看到我的前端在使用全文索引的search结果中返回了不真实的或不是最新的数据。

我有什么select? 我很模糊地意识到,可以在单独的服务器上运行全文处理,但我不知道如何实现,或者我是否想要。 我也知道像Lucene.NET的其他选项,但不知道这是否是正确的方法。

我的要求只是在这张表上全文search的能力尽可能最新,同时要记住数据库上的插入速率。

人们会build议什么?

我有一个相当大的MSSQL数据库,每天有大约600万行的表格和大约5万个插入表。

又小又不忙。

我经常看到CPU与100%挂钩,并假设这是运行人口的全文索引。 我也看到我的前端在使用全文索引的search结果中返回了不真实的或不是最新的数据。

你有什么CPU? 得到一个更好的。 另外,全文索引总是滞后 – 这不是实时的。 即使不盯住CPU也会落后。 因为它不是由devisesynchroneus。

我们需要更多的信息。 我想在这一点上build议获得一个数据库服务器,不在100美元易趣使用部分联赛。 你不要说任何东西看起来,但除非你插入2GB的文件,CPU不应该落在后面显着(和一个小的延迟是快速插入的权衡 – 或者使用Lucene.NET并等待全文索引处理完成插入之前,这也不会让你快乐,因为插入可能需要一些时间)。

一般来说,现代服务器(即6-12个真正的处理器内核)应该每天完全跟上5万个插入,除非它们不是在一天中发生,而是在10分钟左右。 自然地取决于大小(50.000 2GB文本斑点很多)。