服务器 Gind.cn
  • Linux
  • Windows
  • Ubuntu
  1. 服务器 Gind.cn
  2. robots.txt
  3. 不允许xml robots.txt
Intereting Posts
解锁我的Windows会话后运行脚本? 在CentOS 6.5上安装FastCGI时出错 FreeIPA:用于添加多个NFS客户端的Keytab文件 有人可以向我解释什么“wget -O – -q icanhazip.com”是什么意思? qdel删除了我所有的工作 推导服务器虚拟化项目是否成功/节省成本的最相关指标? 撤消chmod 777 如何知道IP多播是否在我的networking上启用? Ssd TRIM / DISCARD详细信息 IIS7如何处理低内存? 我怎么能告诉我,如果我有社区,企业,或标准版的MySQL? 无法解压tar.gz.bz2 XP服务器允许所有域用户共享c $ 组策略部分应用 使用mdadm从RAID1arrays中删除驱动器后testing和擦除驱动器是否安全?

不允许xml robots.txt

Google网站站长常见问题解答表明,这将排除search中的所有xml文件:

User-agent: Googlebot Disallow: /*.xml$ 

这是否也适用于其他机器人?

 User-agent: * Disallow: /*.xml$ 

  • webcrawler机器人负载testing我的网站,它没有通过testing
  • 基于主机名的dynamicrobots.txt
  • 机器人文件的行为
  • 理想的WordPress的robots.txt?
  • 如何防止search引擎索引一个特定的url

  • 似乎阻止/我美丽的sef-url-123
  • 这是一个有效的robots.txt文件?
  • Robots.txt与几个VirtualHosts
  • 如何为所有我自己的子域服务robots.txt,而不是Apache上的其他主机?
  • 快速Robots.txt的问题

是的,这是有效的。 但其他机器人是否真正了解和服从完全取决于他们,但!

  • 我怎样才能使用清漆生成robots.txt文件,即使是同一网站的子域?
  • 有没有机会在专用服务器上阻止图像蜘蛛/机器人,而不使用robots.txt或.htaccess?
  • 如何通过REMOTE hostname / domain来阻止Apache中的所有虚拟主机的Spider / Scrapers?
  • 如何阻止在lighttpd请求robots.txt的url?
  • 为什么我的robots.txt不能正常工作?
  • 谷歌机器人旅行在一个完全正常的robots.txt,然后在一个不存在的robots.txt
  • 带有SSL的apache robots.txt
  • 如何阻止假的谷歌蜘蛛和假的网页浏览器访问?
  • 自定义robots.txt在Azure IIS 8中被覆盖
  • GoogleBot尊重用户代理:*

  • © 2017 服务器 Gind.cn
  • Topics
  •        
  • Powered by Server
  • Privacy Policy