Windows Sharepoint服务3 PDFsearch不索引所有单词

我们在Server 2003 R2 Enterprise SP2计算机上安装了Windows SharePoint Services 3。我有安装，configuration和工作的iFilter的Adobe Reader 8。我开始全面爬网，并且在使用search时返回PDFsearch。与以前相比，这是一个很大的改变，因为当时PDF内容search是不存在的。目前业务部门已经注意到，对于某些单词，他没有find合适的PDF。

从各种迹象来看，对于某些PDF而言，并不是所有的词都被编入索引。有人可以帮忙吗？

在PDF中可search的文本方面，有两种types的文件：从Word / etc中保存的文件…“一直是数字的”文件，然后是从纸上扫描的文件，并接收到OCR猜猜这些文字是什么。

iFilter不会OCR文档中的文本。如果您的文档最初是由其他软件扫描的，则该软件可能是可疑的。几乎所有的OCR都是不完善的，有些是可怕的。您可以在打开文档的计算机上使用Acrobat Reader来search文档。这应该告诉你文档中的OCR有多好。

另外请注意这个post，build议OCR的文本可能无法在iFilter 8中工作，并且您可能需要在服务器上安装Reader 9。

最后，如果您可以使用Acrobat Reader来searchPDF中的单词，那么我将把文档和实验室中的SharePoint + iFilter设置为默认设置，并查看iFilter是否真的有问题。

我曾经跟随过微软的各种知识库文章，其中包括您需要的所有内容，然后仍然无法searchPDF中的所有文本内容。

我已经检查过，以确保在PDF本身（在读者）search单词的作品，它做到了，所以这不是一个OCR问题。对于我的问题，发现了以下问题，必须改变/恢复：

升级到Reader X彻底打破了PDF内容的search。我仍然可以search标题和说明，但PDF的内容不可search。我不得不重新安装Adobe Reader 8。
运行search服务的服务帐户必须是索引服务器上的完整pipe理员。

总结：我必须以完整的pipe理员身份添加服务帐户，然后确保已logging的步骤再次进行（在我的情况下确认），现在瞧，解决了。