从磁盘故障备份数据的最佳方法？

由于许多人喜欢将数据备份到多个备份存储，这不是一个完美的select。

让我们说一个存储在服务器中的video文件，该服务器连接到群集中的数百个其他服务器。备份机制每天自动备份到备份存储。

但有一天，影响该video文件的坏扇区发生（永久磁盘损坏）。

备份机制只是照常备份video。 * nix服务器不知道该video文件是否因为磁盘损坏而损坏。 2个月后，较旧的备份快照会自动从备份存储中删除。所以，该video文件的所有副本都是坏的文件。

当一个访客试图播放该video文件的video时，它会卡在中间。想象一下，这发生在YouTube上。这是可耻的。

我认为这样的备份机制不是有效的，需要太多的空间。

那么从磁盘故障中备份数据的最好方法是什么？

也许像每月的数据快照，除了每天/每小时的备份正在发生。静态数据从中受益，因为它永远不会改变，所以上个月的备份结束，和上个月一样，等等。

这听起来像是你正在谈论一个简单的2个月“完整”风格的备份，当然，这将永远是最后的风格。即使在2周的磁带备份最基本的备份，你将有10磁带做你的MF备份2周，一个月结束。那些每周10个磁带将会一直在旋转，最长的磁带将会每两周写一次。

这就是为什么使用祖父 – 父子备份轮换的原因。虽然我发现自己回溯到几个月的磁带价值，因为用户比任何硬件问题更频繁地覆盖或滥用他们的文件。

为确保数据保留，可以实现校验和系统。每周交叉检查MD5，如果发生校验和错误，停止备份删除。从正确的备份重播有问题的文件。

很长时间的数据保留是一个痛苦，的确如此。

卷快照不帮助，因为除非在快照之间写入文件，坏块没有被复制到VSScaching文件。

当扇区出现永久性磁盘错误时，系统会通知您此文件的备份将失败。如果你没有阅读你的日志文件，运气不好。

SIS或重复数据删除的存储，其中多个备份会话保留在备份存储中，但是被重复数据删除，其中只有唯一的对象（取决于实际实现的文件或数据块）实际上是从多个备份会话中添加的。这样，对原始文件的任何改变都将导致SIS /重复数据删除系统中的新对象。如果只有“净新”对象实际存储为备份存储的附加内容，那么SIS /重复数据删除将非常有效，所有“重复”对象只是链接到其单个实例。

这是更多的数据保留政策问题。就个人而言，如果你有一个人们每天或经常使用的大文件，但是没有人注意到这个文件已经损坏了几个月，我会质疑这些数据的价值有多大，但是有些情况可能发生。

无论如何，解决scheme可能是在永久删除之前将数据定期存档。每年，甚至6个月等等，这样，如果数据被完全清除，那么您就有一个“以防万一”的存储平台。

但是这又是一个数据保留策略的问题。如果你非常担心这样的事情，你可以尝试使用一个校验和系统来比较文件，看看有什么东西随着时间的推移而变化。当文件被改变时，这也给入侵检测带来好处，不应该改变。