我正在寻找一个Ubuntu的解决scheme,索引PDF(和PS?)文件以供日后search。
标准是:
在我的情况下,我想索引一个学术期刊文章的文件夹,因此要求,无论什么软件创build的PDF一致工作。 我已经在使用一个参考pipe理器,所以不会取而代之。
例如:Beagle的一个很好的前端,一个允许它索引PDF的插件将是完美的。
跟踪器跟Beagle和Strigi一样,但是和Beagle相反,它是用纯C编写的(Beagle是一个Mono应用程序)。 据说,比比格尔要快得多,虽然我自己也没有做过math。
我找不到链接到Tracker的链接,但是我确定它是在默认的Ubuntu存储库中。
Lucene对PDF,HTML,Microsoft Word和OpenDocument进行全文索引。 这只是一个库,但有几个应用程序/ CMS使用它,或者你可以用它作为自己的解决scheme的基础。
它是免费软件(Apache许可证)。
编辑:
如果你正在寻找一个前端的东西,你可能会考虑Beagle或Strigi:
比格尔
Strigi的
我使用谷歌桌面search在Linux上。 不是免费的,但这是我find的最好的。