扫描HTML文件夹中未使用的资源

我有一个老化的网站,我正在pipe理,我想删除所有不在本站的各种文件夹中的所有未使用的外部文件(.css,.jpg,.js等)。

有没有可以帮助我识别和/或删除这些工具的工具?

有几个实用程序可以下载整个网站。 运行一个,按照您的网站的所有链接,但不能到任何其他网站。 任何不在结果存档中的东西都可以删除。

我的第一个想法是编写一个脚本,将几个月的原始日志文件缩减到它们的URI部分,然后收集一个目录列表,最后遍历目录列表并列出没有对应的所有东西出现在浓缩的日志文件中。

Dramweaver和Expression Web等几个编辑器都有内置的实用程序来检测站点中未链接的文件。 我不知道有没有免费的工具,但如果没有,我会感到惊讶。