arxiv.org反机器人“search和销毁”实际上做了什么?

lanl.arxiv.orgmath和科学预印本服务(以前称为xxx.lanl.gov )对于忽视机器人的机器人有严格的政策.txt , Robots Beware 。 在这个页面上,有一个标有“点击这里启动自动”search和摧毁“对您的网站”,这是robots.txt禁止的链接,但大概行为不端的机器人会遵循它,并收获的后果。 这个问题,实际的后果是什么? 我从来没有胆量,实际上点击该链接,看看它是什么。 他们能做些什么既有效又合法?

[反向DNS结果]:您已被识别为违反arxiv.org上发布的指导方针的机器人。

如果这个决定是错误的,请报告给[email protected],以便调查您的问题。

 Scanning, Initialized: 10 minutes to Trinity... 9 minutes to Trinity... 8 minutes to Trinity... 7 minutes to Trinity... 6 minutes to Trinity... 5 minutes to Trinity... 4 minutes to Trinity... 3 minutes to Trinity... 2 minutes to Trinity... 1 minute to Trinity... 

接地零。 祝你今天愉快。

联系

所以…这个页面会浪费10分钟的一个非常天真的机器人的时间。 对付恶意僵尸程序可能没用,但是在面对一个糟糕的网站刮板时可能会节省一些带宽。

没有其他的结果,除了旋转一下。 大多数浏览器(也可能是他们的服务器)稍后会超时。 他们可能只是比机器人对自己造成更多的伤害。