服务器 Gind.cn
  • Linux
  • Windows
  • Ubuntu
  1. 服务器 Gind.cn
  2. robots.txt
  3. 不允许xml robots.txt
Intereting Posts
如何禁用Postgres 8.1.22上的autovacuum? 为什么在向用户发送邮件时,postfix会向本地假脱机文件发送退信通知? 如何获取应用程序事件日志的应用程序 如何在Samba机器上使用本地帐户 用于从客户端login的Dovecotconfiguration(outlook) 在Apache中安装RApache模块 SSH中止身份validation失败太多 我怎样才能使这个脚本更好? openiscsi启动器共享ext3磁盘 DNS DKIM设置公钥 我怎么能看到为什么我的Riak集群没有在机器上运行压缩阶段? 设置网站的文档模式,我们不控制 SQL Server发送邮件到Exchange 2016 DAG提供证书错误 Windows服务器任务计划程序:运行预定的可执行文件安全吗? 通过VPN连接阻止AFP共享访问?

不允许xml robots.txt

Google网站站长常见问题解答表明,这将排除search中的所有xml文件:

User-agent: Googlebot Disallow: /*.xml$ 

这是否也适用于其他机器人?

 User-agent: * Disallow: /*.xml$ 

  • webcrawler机器人负载testing我的网站,它没有通过testing
  • 基于主机名的dynamicrobots.txt
  • 机器人文件的行为
  • 理想的WordPress的robots.txt?
  • 如何防止search引擎索引一个特定的url

  • 似乎阻止/我美丽的sef-url-123
  • 这是一个有效的robots.txt文件?
  • Robots.txt与几个VirtualHosts
  • 如何为所有我自己的子域服务robots.txt,而不是Apache上的其他主机?
  • 快速Robots.txt的问题

是的,这是有效的。 但其他机器人是否真正了解和服从完全取决于他们,但!

  • 我怎样才能使用清漆生成robots.txt文件,即使是同一网站的子域?
  • 有没有机会在专用服务器上阻止图像蜘蛛/机器人,而不使用robots.txt或.htaccess?
  • 如何通过REMOTE hostname / domain来阻止Apache中的所有虚拟主机的Spider / Scrapers?
  • 如何阻止在lighttpd请求robots.txt的url?
  • 为什么我的robots.txt不能正常工作?
  • 谷歌机器人旅行在一个完全正常的robots.txt,然后在一个不存在的robots.txt
  • 带有SSL的apache robots.txt
  • 如何阻止假的谷歌蜘蛛和假的网页浏览器访问?
  • 自定义robots.txt在Azure IIS 8中被覆盖
  • GoogleBot尊重用户代理:*

  • © 2017 服务器 Gind.cn
  • Topics
  •        
  • Powered by Server
  • Privacy Policy