我应该如何检查一个网站的死链接?

我应该如何检查我的网站的死链接? 我已经使用了一些基于Web的工具,没关系,例如:

  • http://dead-links.com
  • http://validator.w3.org/checklink

过去我使用过一些免费软件,比如Xenu 。

我真的很喜欢能够以我可以做的事情的格式导出报告,比如CSV或XML。 你用什么?

IISsearch引擎优化工具包是伟大的。 它不仅仅是search断开的链接。 http://www.iis.net/extensions/SEOToolkit

您可以使用这些数据运行报告,并且还可以随时跟踪报告。

我有一台Linux机器,它有一个运行linkchecker向我发送报告的cron作业。

http://wummel.github.io/linkchecker/

如果你正在运行Ubuntu,它在包pipe理器中。

sudo aptitude install linkchecker man linkchecker 

很多的select。 适合我。 可以以各种格式保存报告。

我会投票给Xenu 。 令人费神的速度,给你各种其他的function。

我还没有尝试过,但是昨天晚上我碰到了它,而我试图打败wget做别的事情。 可能会或可能不会对你的情况有所帮助。

  --spider When invoked with this option, Wget will behave as a Web spider, which means that it will not download the pages, just check that they are there. For example, you can use Wget to check your book‐ marks: wget --spider --force-html -i bookmarks.html This feature needs much more work for Wget to get close to the functionality of real web spiders. 

我个人会使用一些服务器端日志分析器来持续监视死链接。 Webalizer / Awstats和其他工具可以通过parsing你的web服务器日志来给你一个404 Not Found错误的报告。

这种方法的优点:您还可以捕获到您的网站的不正确的链接,可能会发布在其他网站,用户input错误等等。 而且这是持续的监控,而不是一次运行一些无效链接检查器。

你可以结合这个网站镜像软件如httrack。 只要抓取您的网站,然后从日志parsing工具之一获取报告。

也有一些桌面应用程序可以parsingApache日志文件,并给你一个很好的报告任何404错误。