Articles of 索引

在Ubuntu上索引PDF文件

我正在寻找一个Ubuntu的解决scheme,索引PDF(和PS?)文件以供日后search。 标准是: 兼容性:通常提取文本取决于用于创buildPDF的软件。 一些PDF也可以被“locking”,我想我应该尊重。 searchfunction:通配符,正则expression式,“模糊”匹配。 search速度 在我的情况下,我想索引一个学术期刊文章的文件夹,因此要求,无论什么软件创build的PDF一致工作。 我已经在使用一个参考pipe理器,所以不会取而代之。 例如:Beagle的一个很好的前端,一个允许它索引PDF的插件将是完美的。

使用Google自定义search为您的网站编制索引

我刚刚实施了这个网站 。 我正在尝试让Google自定义search为我的网站工作,但是我不能做到。 我做了几件事情: 添加“ http://www.saferoutesga.org ”作为控制面板中的网站,并设置“从该页面dynamic提取链接并将其添加到我的search引擎”,并添加“包含此页面链接的所有部分网站”选项。 显式地给它一个页面索引: http : //www.saferoutesga.org/Sitemap 设置一个站点地图文件并注册它: http : //www.saferoutesga.org/sitemap.axd 我唯一能做的就是上面的第二个项目。 您会看到是否使用网站页脚中包含的search栏。 如果可以的话,我想避免明确地索引每一页。 此外,我不想记住每次更新后手动重新索引。 我究竟做错了什么?

禁用的Apache目录索引不recursion应用,是我的configuration或理解错误?

我在Debian上运行Apache(2)。 我想禁用/ var / www目录及其任何子目录中的自动索引。 在/etc/apache2/conf.d我把一个文件的内容如下: <Directory /var/www> Options -Indexes </Directory> 我的印象是,这个指令将被recursion地应用于/ var / www的任何子目录,但是访问(比如缺less一个index.html)/ var / www / someotherdir(即使在重新启动后也会给我一个目录内容的列表) apache(apache2ctl重新启动)。 我误解了这里的recursion,需要使用.htaccess文件吗? 最好的祝福! 🙂 编辑为互联网: 我通过我的“主”或“根”configuration文件/etc/apache2/apache2.conf,并find以下包含指令,按以下顺序: include mods-enabled/*.load include mods-enabled/*.conf include httpd.conf include ports.conf include conf.d/ include sites-enabled/ 虽然大多数conf文件没有与/ var / www列表选项相关的任何内容,但启用了sites的dir拥有一个名为000-default的文件,该文件又保存了一个虚拟主机文章,为/ var指定了一些选项/ www dir。 喜欢这个: <VirtualHost *:80> <Directory /var/www/> Options Indexes FollowSymLinks MultiViews AllowOverride […]

403错误; 将不会代理:NginX和Node.js

我目前有一个设置,所有静态文件都由NginX提供,如果没有find静态文件,它将被移动到一个node.js服务器上。 不幸的是,我得到了根请求403错误。 其他一切工作正常。 server { listen *:80; error_page 404 = /404.html; root /web/sites/this.site.tld/static; index home; location / { try_files $uri $uri/ @proxy; } location @proxy { proxy_set_header X-Real-IP $remote_addr; proxy_set_header X-Forwarded-For $proxy_add_X_forwarded_for; proxy_set_header Host $http_host; proxy_set_header X-NginX-Proxy true; proxy_pass http://thisSiteApp; proxy_redirect off; } } upstream thisSiteApp{ server 127.0.0.1:3000; } 我相当确定问题在于索引指令。 在静态中放置一个“index.html”文件并将该指令更改为“index index.html”的作品。 但是我真正想要做的是让它看起来像索引位置的节点服务器,而仍然服务我的静态文件,而不看节点。 NB。 如果我把代理服务器设置放在/位置节点服务器服务的根就好(没有静态文件,但它服务的一部分罚款)。

什么时候索引不值得更新

是否有一个公认的阅读与写作的比例,使得一个指数有价值,还是不那么切割和干燥? 我正在使用这个: WITH UnusedIndexQuery ( Object_ID, ObjectName, IndexName, Index_ID, Reads, Writes, Rows ) AS ( SELECT s.object_id , objectname = OBJECT_NAME(s.OBJECT_ID) , indexname = i.name , i.index_id , reads = user_seeks + user_scans + user_lookups , writes = user_updates , p.rows FROM sys.dm_db_index_usage_stats s JOIN sys.indexes i ON i.index_id = s.index_id AND s.OBJECT_ID = i.OBJECT_ID […]

列出没有索引的MySQL JOINS

有什么办法可以生成在MySQL中没有索引的连接列表?

Windows 7客户端无法在Server 2008 R2文件服务器上search索引文件

我一直有问题让我们的文件服务器上的Windowssearch服务,以提供我们的Windows 7客户端search服务器上的索引文件的能力。 我已经有Windowssearch服务工作正常(在服务器上search工作),但我没有运气find服务器上的内容,使用客户端上的search工具。 什么可能导致这个问题?

推荐的SSD设置

我正在构build一个新的服务器,它将运行我们的在线Web服务的文本search服务。 这项服务需要快速的IO,所以我正试图进一步减less任何潜在的瓶颈。 我很想听听关于SSD(或其他),硬件控制器,品牌和型号,好故事,坏故事或其他相关的一些build议。 这项服务将build立的指标应该是小的,所以我认为64GB的驱动器将是远远不够的。 提前致谢! 编辑:我必须使用的预算将是$ 4,000 CDN左右。

mysql 5.0.23 vs 5.5性能好处和升级问题?

有人告诉我,与5.5版本相比,mysql 5.5有显着的性能提升 我们的服务器处理大量的数据(每5-10秒处理大约3000万条logging),并要求我们可以提高性能。 从5.0.23升级到MySQL 5.5会有好处吗? 另外,我们在表上设置了很多的数据库索引,而且我被告知有时索引在版本升级之后会变坏,并且必须重build。 这是真的?

search引擎的networking共享

我们有一个集群存储服务器,其中包含许多像Corel,Indesign,Edius,Adobe Premiere等项目文件。还有很多图像,audio和video文件。 我们正在使用SharePoint和FAST Search来索引这些networking共享。 但是sharepoint或者只能抓取某些文件types。 我不在寻找一个索引这些不可能的文件types的search引擎。 我寻找一个search引擎,导致用户可以标记这些文件。 所以如果有人search一个关键字,用这个关键字标记的文件可以在search结果中。 简而言之,我正在寻找具有以下function的search引擎: 索引和抓取networking共享(特别是DFS和SMB)。 基于Web的searchGUI。 用户可以标记文件以及networking共享中的文件夹,用户可以在标签中search。 安全修整; 如果有人没有阅读共享的权限,他/她在search结果中看不到该文件/文件夹 在基于Web的文件pipe理器中浏览文件共享以进行标记或查看预览。 search结果中的图像,video预览; 不是那么重要,但是很好。 基于农场的架构(集群在多台服务器上进行爬网); 不重要,但有好处。 Sharepoint和快速search服务器支持这些function,除了标记和浏览networking共享。