我正在寻找一种有效pipe理和利用文件系统中的所有文件的文件级校验和的方法。
目标:
可configuration的快速刷新 – 当其他标准指示可能的更改(文件大小,时间戳,第一个和最后一个块已更改等)时,仅重新校验大文件。 我说“可configuration”,因为一些用例不能相信时间戳没有改变等等。
快速查询特定的校验和(换句话说,回答“我已经有这个文件?”的问题)在整个文件系统
一种比较跨文件系统的数据的方法(本地在解决scheme中,或机器可读的导出,以便比较可以编写脚本)
支持多哈希
重复的文件报告(我不希望解决scheme通过交互式重复数据消除会话;机器可读的报告输出将是好的)
Nice-to-Have:可以select(重新)在每个目录(“CHECKSUM”,“MD5SUM”或类似的)中生成传统校验和文件的方式,以便通过FTP或Web公开的子目录可以轻松地使用校验和
关键的思想是以这种方式对哈希进行快速更新和快速查询。