lanl.arxiv.orgmath和科学预印本服务(以前称为xxx.lanl.gov )对于忽视机器人的机器人有严格的政策.txt , Robots Beware 。 在这个页面上,有一个标有“点击这里启动自动”search和摧毁“对您的网站”,这是robots.txt
禁止的链接,但大概行为不端的机器人会遵循它,并收获的后果。 这个问题,实际的后果是什么? 我从来没有胆量,实际上点击该链接,看看它是什么。 他们能做些什么既有效又合法?
[反向DNS结果]:您已被识别为违反arxiv.org上发布的指导方针的机器人。
如果这个决定是错误的,请报告给[email protected],以便调查您的问题。
Scanning, Initialized: 10 minutes to Trinity... 9 minutes to Trinity... 8 minutes to Trinity... 7 minutes to Trinity... 6 minutes to Trinity... 5 minutes to Trinity... 4 minutes to Trinity... 3 minutes to Trinity... 2 minutes to Trinity... 1 minute to Trinity...
接地零。 祝你今天愉快。
联系
所以…这个页面会浪费10分钟的一个非常天真的机器人的时间。 对付恶意僵尸程序可能没用,但是在面对一个糟糕的网站刮板时可能会节省一些带宽。
没有其他的结果,除了旋转一下。 大多数浏览器(也可能是他们的服务器)稍后会超时。 他们可能只是比机器人对自己造成更多的伤害。