Googlebot出现问题

Googlebot不断尝试对我们的服务器中不存在的URL进行索引，所以它始终得到404错误。我们没有任何关于该网站的参考（我认为这是一个来自尼日利亚的博客），所以我不知道Google为什么试图访问这些网页。

奇怪的是，我无法在互联网上find这个网站，就像它不存在任何地方。

这是我的日志中的条目的一个例子：

66.249.72.201 - - [17/Sep/2011:10:08:10 +0200] "GET /main.php/v/Agadez+2006/Tagama/IMG_1214.JPG.html?g2_imageViewsIndex=3&g2_fromNavId=x50ca95f2 HTTP/1.1" 404 245 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"

有什么想法发生了什么？

已知GoogleBot尝试过去一段时间存在的URL。例如，我最近做了一个彻底的检修我的网站。过去索引的旧url仍然在数月后被Googlebot击中（404）。我知道一个事实，我的网站并没有以任何方式在内部使用这些URL。有些是由外部网站链接; 有些甚至没有连接到外部。

如果您尚未使用Google网站pipe理员工具，则可能需要使用Google网站pipe理员工具。您可以使用这些工具来查看索引的内容以及404的内容。您还可以查看哪些页面与哪些外部位置链接。

谷歌声称是抓取互联网，并辨认相关内容，为search者提供价值。在这样做的过程中，Google严重依赖来自其他网站的入站链接，作为对您网站的“信任投票”。如果在其他网站上有关于networking的链接，Google会按照链接search内容进行索引。

我怀疑你的域名的以前的所有者（在你注册之前）有其他地方的内部链接到创作的内容。现在您已经监pipe了域名，并且内容不再存在，Google会收到404错误。

在一个完美的世界中，Google会记得收到404错误，并且不会再次抓取这些链接。不幸的是，GoogleBot是复杂的，不断变化的，所以很难猜测会发生什么。

我有一个类似的经验与新注册的域名 – 你可以放心地忽略这种行为。它不会对您的排名产生可持续的影响。

怎么了？ Google正在访问您的网站。完全不用担心。

如果您担心某事，请阅读给定的url： http ： //www.google.com/bot.html

如果您不希望Google访问您的网站，则可以阻止IP范围。在这种情况下，没有页面将被索引。

从单个URL无法判断这是否实用，但我首先要看的是将一部分URL添加到robots.txt文件。