由于许多人喜欢将数据备份到多个备份存储,这不是一个完美的select。
让我们说一个存储在服务器中的video文件,该服务器连接到群集中的数百个其他服务器。 备份机制每天自动备份到备份存储。
但有一天,影响该video文件的坏扇区发生(永久磁盘损坏)。
备份机制只是照常备份video。 * nix服务器不知道该video文件是否因为磁盘损坏而损坏。 2个月后,较旧的备份快照会自动从备份存储中删除。 所以,该video文件的所有副本都是坏的文件。
当一个访客试图播放该video文件的video时,它会卡在中间。 想象一下,这发生在YouTube上。 这是可耻的。
我认为这样的备份机制不是有效的,需要太多的空间。
那么从磁盘故障中备份数据的最好方法是什么?
也许像每月的数据快照,除了每天/每小时的备份正在发生。 静态数据从中受益,因为它永远不会改变,所以上个月的备份结束,和上个月一样,等等。
这听起来像是你正在谈论一个简单的2个月“完整”风格的备份,当然,这将永远是最后的风格。 即使在2周的磁带备份最基本的备份,你将有10磁带做你的MF备份2周,一个月结束。 那些每周10个磁带将会一直在旋转,最长的磁带将会每两周写一次。
这就是为什么使用祖父 – 父子备份轮换的原因。 虽然我发现自己回溯到几个月的磁带价值,因为用户比任何硬件问题更频繁地覆盖或滥用他们的文件。
为确保数据保留,可以实现校验和系统。 每周交叉检查MD5,如果发生校验和错误,停止备份删除。 从正确的备份重播有问题的文件。
很长时间的数据保留是一个痛苦,的确如此。
卷快照不帮助,因为除非在快照之间写入文件,坏块没有被复制到VSScaching文件。
当扇区出现永久性磁盘错误时,系统会通知您此文件的备份将失败。 如果你没有阅读你的日志文件,运气不好。
SIS或重复数据删除的存储,其中多个备份会话保留在备份存储中,但是被重复数据删除,其中只有唯一的对象(取决于实际实现的文件或数据块)实际上是从多个备份会话中添加的。 这样,对原始文件的任何改变都将导致SIS /重复数据删除系统中的新对象。 如果只有“净新”对象实际存储为备份存储的附加内容,那么SIS /重复数据删除将非常有效,所有“重复”对象只是链接到其单个实例。
这是更多的数据保留政策问题。 就个人而言,如果你有一个人们每天或经常使用的大文件,但是没有人注意到这个文件已经损坏了几个月,我会质疑这些数据的价值有多大,但是有些情况可能发生。
无论如何,解决scheme可能是在永久删除之前将数据定期存档。 每年,甚至6个月等等,这样,如果数据被完全清除,那么您就有一个“以防万一”的存储平台。
但是这又是一个数据保留策略的问题。 如果你非常担心这样的事情,你可以尝试使用一个校验和系统来比较文件,看看有什么东西随着时间的推移而变化。 当文件被改变时,这也给入侵检测带来好处,不应该改变。