这里列出了几个重复的Linux文件查找器。 我已经尝试了fdupes和fslint。 但是,从我所看到的,这些将会find所选目录结构/searchpath的所有重复项,因此也会重复存在于其中一个searchpath中(如果select多个)。
然而,我需要的是根据参考pathsearch重复项,我可以在其中定义一个path作为参考path,并在其他path中search参考path中存在的文件,以便将其删除。
我需要这样做,准备两个不同步的大型目录结构,其中一个比另一个更新(这将是我的参考)。 大部分的文件应该是两者之间的重复,但我怀疑还有一些文件只在另一个path上,所以我不想删除它。
为了达到这个目的,我可能有一些select可以忽略吗?
我已经尝试编写一个Python脚本来清理fdupes输出的列表,但不能成功。
rmlint可以做到这一点:
rmlint --types=duplicates --must-match-tagged --keep-all-tagged <path1> // <path2>
这将在path2中findpath1中具有重复(相同数据内容)的文件。 它将创build一个shell脚本,如果运行,将删除path1下的重复项,只保留唯一的文件。