如何在Linux中查找参考目录结构的重复文件

这里列出了几个重复的Linux文件查找器。 我已经尝试了fdupes和fslint。 但是,从我所看到的,这些将会find所选目录结构/searchpath的所有重复项,因此也会重复存在于其中一个searchpath中(如果select多个)。

然而,我需要的是根据参考pathsearch重复项,我可以在其中定义一个path作为参考path,并在其他path中search参考path中存在的文件,以便将其删除。

我需要这样做,准备两个不同步的大型目录结构,其中一个比另一个更新(这将是我的参考)。 大部分的文件应该是两者之间的重复,但我怀疑还有一些文件只在另一个path上,所以我不想删除它。

为了达到这个目的,我可能有一些select可以忽略吗?

我已经尝试编写一个Python脚本来清理fdupes输出的列表,但不能成功。

rmlint可以做到这一点:

 rmlint --types=duplicates --must-match-tagged --keep-all-tagged <path1> // <path2> 

这将在path2中findpath1中具有重复(相同数据内容)的文件。 它将创build一个shell脚本,如果运行,将删除path1下的重复项,只保留唯一的文件。