添加一个基于Web的文档search到我的debian文件服务器

我有一个基于Samba的文件服务器,其中包含大量的数据,主要是Word,Excel,OpenOffice和PDF文档。

我已经build立了一个简单的基于Web的search界面(Apache,PHP,mlocate),只是在filepaths + mtime上进行。 它的工作原理就是这样,但是将所有的文档编入Apache Solr是非常好的,因为所有的账户都是非常快的,可以处理所有这些不同的文档types。

但它是一个文件服务器,而不是一个网站,所以我需要一些东西来抓取所有文件,并不断抓取和重新索引更新的文件; 人们不是“发布”文件,他们只是按保存。

有没有这样的项目?

检查outotify。 它会立即通知您有关文件系统事件。

我不确定这是提问者想要的,但是其他人正在寻找一个网页界面,请大家看看这个:

https://github.com/kaazoo/weblocate