我应该如何检查我的网站的死链接? 我已经使用了一些基于Web的工具,没关系,例如:
过去我使用过一些免费软件,比如Xenu 。
我真的很喜欢能够以我可以做的事情的格式导出报告,比如CSV或XML。 你用什么?
IISsearch引擎优化工具包是伟大的。 它不仅仅是search断开的链接。 http://www.iis.net/extensions/SEOToolkit
您可以使用这些数据运行报告,并且还可以随时跟踪报告。
我有一台Linux机器,它有一个运行linkchecker向我发送报告的cron作业。
http://wummel.github.io/linkchecker/
如果你正在运行Ubuntu,它在包pipe理器中。
sudo aptitude install linkchecker man linkchecker
很多的select。 适合我。 可以以各种格式保存报告。
我会投票给Xenu 。 令人费神的速度,给你各种其他的function。
我还没有尝试过,但是昨天晚上我碰到了它,而我试图打败wget做别的事情。 可能会或可能不会对你的情况有所帮助。
--spider When invoked with this option, Wget will behave as a Web spider, which means that it will not download the pages, just check that they are there. For example, you can use Wget to check your book‐ marks: wget --spider --force-html -i bookmarks.html This feature needs much more work for Wget to get close to the functionality of real web spiders.
我个人会使用一些服务器端日志分析器来持续监视死链接。 Webalizer / Awstats和其他工具可以通过parsing你的web服务器日志来给你一个404 Not Found错误的报告。
这种方法的优点:您还可以捕获到您的网站的不正确的链接,可能会发布在其他网站,用户input错误等等。 而且这是持续的监控,而不是一次运行一些无效链接检查器。
你可以结合这个网站镜像软件如httrack。 只要抓取您的网站,然后从日志parsing工具之一获取报告。
也有一些桌面应用程序可以parsingApache日志文件,并给你一个很好的报告任何404错误。