Articles of search

谷歌search引擎

我正在研究一个谷歌框,像这样, http://mytwentyfive.com/blog/wp-content/uploads/byme/Google%20Search%20Appliances.jpg 我将抓取工具指向有html文件的文件夹。 在抓取工具抓取这些文件并将其编入索引之前,现在它会find该模式或文件夹,但不会跟踪文件夹中的任何html文件。 我已经尝试过所有我能够知道的事情,但是,想不出别的什么。 有人可以帮忙吗? 谢谢

删除文件和文件夹

任何人都可以推荐一个实用工具(希望便宜/免费),这将允许我跨多个CIFS股份search多个文件名/types,然后删除它们? 我们遇到了问题,我们的用户保存文件,他们不应该是,并希望“打扫房间”。

在Linux中帮助search

我有点儿是整个Linux的新手,但我有一个doozie的时间试图找出如何筛选我的qmail日志文件。 在这一点上,我想要做的是做一个search,输出qmail-local-handlers后方括号内的内容。 所以,例如,我的日志片段中的第一行… (Oct 3 10:17:21 125388-web2 qmail-local-handlers [18145]:[email protected]) …我想要它输出18145。 我不知道我可以运行什么命令来获得我正在寻找的结果。 谁能帮忙? 这里是我使用的一些示例数据,如果它会帮助。 非常感谢!! Oct 3 10:17:21 125388-web2 qmail-local-handlers [18145]:[email protected] | Oct 3 10:29:14 125388-web2 qmail-local-handlers [22908]:[email protected] | Oct 3 10:29:30 125388-web2 qmail-local-handlers [23017]:[email protected] | Oct 3 10:30:58 125388-web2 qmail-local-handlers [23815]:[email protected] | Oct 3 10:31:04 125388-web2 qmail-local-handlers [23861]:[email protected] | Oct 3 12:06:52 125388-web2 qmail-local-handlers [30174]:[email protected] […]

在“隐藏”“www”域名前缀时redirectvs重写是否有优势?

使用虚拟主机,我已经习惯了使用这个: <VirtualHost: *:80> ServerName www.example.com Redirect permanent / http://example.com/ </VirtualHost> 但我常常看到重写使用: RewriteEngine On RewriteCond %{HTTP_HOST} ^www.example.com$ [NC] RewriteRule ^(.*)$ http://example.com/$1 [R=301,L] 一种方法比另一种更有优势吗?

只有一个Apache Solr可以search多个/跨域CMS吗?

Solr的单实例可能跨多个应用程序使用跨域吗? 像多个CMS,如Wordpress + Joomla + Drupal。 任何地方的任何search都应显示所有连接的应用程序的结果。 例如: 如果我从Wordpress网站search一个词的marketing ,它应该输出Wordpress本身的结果,也从Joomla和Drupal网站的内容。 可能吗?

SEO – 多个urlpath

我有一个Web应用程序,提供有关天气的信息。 我正试图尽可能地发现这些信息。 我的问题是,在不同的URLpath下多次发布相同的内容是一个好主意吗? 例如,如果我有相同的内容发布在: http://www.mydomain.com/weather/[year]/[month]/[day]/index.html和http://www.mydomain.com/weather/[year]-[month]-[day ] /index.html 如果你这样做,search引擎会阻止你的网站?

Google Mini – 如何打开案例?

我有一个谷歌迷你,我不能打开案件? 这似乎是一个简单的情况,但我无法弄清楚。 我删除了在后面的两个螺丝,我期待滑回顶部,它会像我这样做的1000个其他服务器删除。 我无法得到它。 有谁知道如何?

SQL2000和SQL2008上的全文search有什么重大区别?

我第一次testing得到一个给定的数据库与激活全文search运行在sql2008上失败的结果,它蠕变。 sql2008花了几个时间的sql2000,但为什么?

CPU使用率突然高峰

我们在12个核心,96GB RAM,4个旋转磁盘机器上运行4节点/机器弹性search群集。 在正常的操作下,大部分的CPU使用率是用户的,大约在5-10%。 每隔几天,机器的一个CPU使用率就会达到80-100%,所有的用户和系统 – 实际上等待下降。 我们首先认为这是一个弹性search的具体问题,但广泛的debugging后,似乎并不是这样: 高cpu利用率仍然存在弹性search节点进程重启 弹性search线程都正常工作,事情只需要10倍的时间。 非弹性search操作(gc collection)也要花费10倍的时间,但堆活动是正常的 如果我们停止大约一个小时的过程,然后只重新启动过程(而不是机器),问题就会消失,事情会很好的工作几天。 我们也注意到在这个问题上,磁盘拷贝testing非常慢。 在进程已经启动但空闲的情况下(不是索引/search数据),或者在进程停止后不久,通过dd复制1GB文件在有问题的机器上以约18MB / s的速度发生,而在健康状态下则以490MB / s的速度发生。 有趣的是,我们注意到使用dstat,在执行任何I / O操作之前,慢速复制需要大约25秒,然后再花30秒完成。 strace产量似乎没有明显的不同。 任何想法,我们可以运行进一步的testing?

Windowssearch索引器使用高CPU使用率

我们有一个Windows Server 2012.有时Windows Indexer的CPU使用率太高。 什么可能导致这个问题,如何才能解决。 它运行几个星期,然后花费太多的CPU负载。 什么是解决这个问题最简单的方法? 你需要更多的细节? 当我看起来twith Processmon似乎有时访问奇怪的registry值,如:HKCR.com($ e8f18eb3)/ 0 / Posteingang / _DPM /곯가가가갦겼곱갮갢갢겥겧곭곟곭곟곬겢갘겷갤걠걍각 似乎也只有重新启动后才会出现此问题。 然后,当我们重build索引时它会变得更好。