tar档案的重复数据删除

现在我想在我的linux备份服务器上configurationZFS重复数据删除function,并有一个问题。 例如,我在backup1.tar中有1k个文件,在backup2.tar中有1个相同的文件和1个新的文件。 这个文件将被重复删除或不是? 正如我所看到的,它不适用于tar档案。 也许我做错了什么。

有可能从焦油的一些块将是相同的,但不太可能。 ZFS在块级别进行重复数据删除(在ZFS说法中称为logging大小),因此各个块需要相同。 焦油基本上保证有完全相同的内容运行,但是否构成一个整体块并且被块alignment是极不可能的。

如果要利用ZFS重复数据删除技术进行备份,请使用快照和发送/接收function。 这具有使用松散空间的普通缺点(存储分配给logging块中的文件,如果文件没有使用整个块,剩下的空间就会浪费)。 Tar避免了这个“问题”,但是您必须创build增量的tar备份来重新创build重复数据删除效果。

ZFS重复数据删除是基于块的,因此它应该考虑到您的归档的内容。

  • TAR档案有多大?
  • 你已经启用了压缩function吗?
  • 您使用什么方法来确定重复数据删除率? 标准方法是: zpool status -D poolnamezpool get dedupratio poolname