Windows Sharepoint服务3 PDFsearch不索引所有单词

我们在Server 2003 R2 Enterprise SP2计算机上安装了Windows SharePoint Services 3。 我有安装,configuration和工作的iFilter的Adobe Reader 8。 我开始全面爬网,并且在使用search时返回PDFsearch。 与以前相比,这是一个很大的改变,因为当时PDF内容search是不存在的。 目前业务部门已经注意到,对于某些单词,他没有find合适的PDF。

从各种迹象来看,对于某些PDF而言,并不是所有的词都被编入索引。 有人可以帮忙吗?

在PDF中可search的文本方面,有两种types的文件:从Word / etc中保存的文件…“一直是数字的”文件,然后是从纸上扫描的文件,并接收到OCR猜猜这些文字是什么。

iFilter不会OCR文档中的文本。 如果您的文档最初是由其他软件扫描的,则该软件可能是可疑的。 几乎所有的OCR都是不完善的,有些是可怕的。 您可以在打开文档的计算机上使用Acrobat Reader来search文档。 这应该告诉你文档中的OCR有多好。

另外请注意这个post,build议OCR的文本可能无法在iFilter 8中工作 ,并且您可能需要在服务器上安装Reader 9。

最后,如果您可以使用Acrobat Reader来searchPDF中的单词,那么我将把文档和实验室中的SharePoint + iFilter设置为默认设置,并查看iFilter是否真的有问题。

我曾经跟随过微软的各种知识库文章, 其中包括您需要的所有内容,然后仍然无法searchPDF中的所有文本内容。

我已经检查过,以确保在PDF本身(在读者)search单词的作品,它做到了,所以这不是一个OCR问题。 对于我的问题,发现了以下问题,必须改变/恢复:

  • 升级到Reader X彻底打破了PDF内容的search。 我仍然可以search标题和说明,但PDF的内容不可search。 我不得不重新安装Adobe Reader 8。
  • 运行search服务的服务帐户必须是索引服务器上的完整pipe理员。

总结:我必须以完整的pipe理员身份添加服务帐户,然后确保已logging的步骤再次进行(在我的情况下确认),现在瞧,解决了。