如果拒绝抓取工具通过robots.txt访问目录,如果我直接链接,是否还会索引该目录中的文件?

我拒绝通过robots.txt索引到一个名为pdf的文件夹。 但是,我直接链接到该目录中存在的几个文件。

search引擎,如谷歌索引这些文件,或忽略他们,因为他们驻留在pdf文件夹?

简短的回答:不。

不允许抓取工具将您在robots.txt中放置的url前缀中的任何内容编入索引。

较长的答案:这取决于。

Allow关键字不是标准的一部分,但一些机器人将遵循它。 您可以使用它来允许一个特定的URL,并禁止包含该URL 的整个子树 。 大多数机器人以首场比赛为基础进行比赛。 无论“ Allow和“ Disallow行的顺序如何,Google和Bing都能以最长的string为基础工作。