备份大型图书馆

我有一个相当大的大约50TB的库,我至less需要每周备份一次。 目前,video内容存储在一系列search到的3TB硬盘上。 我估计每周新内容的数量约为300GB。

云解决scheme已经不存在了,因为这个数量的存储过于昂贵。

对于如何备份这个数字图书馆,你有什么build议? 那LTO-5磁带呢?

通过我的math,你可以在大约170周或者3年的时间里完成营业额。

确定恢复时间目标(RTO)的关键是您的用户需要提高生产力的数据。 由于这是video文件,我猜想最先恢复最新的数据会使您的图书馆的其他部分在线。 但只有你知道多久访问旧的东西。

你会惊讶磁带如何处理这样的工作。 video文件大而长,如果它们不分片,那么所有这些都可以非常快速地传输。 而且重要的是,由于它是大量的连续写入,所以会恢复得非常快。 与数据库交叉引用的每周换网磁带跟踪每个磁带上的内容,如果需要,可以为您提供相当大的离线存档。

如果您的video是一次写入多次读取的video,那么只需每周更改一次数据备份以及数据复制解决scheme即可。 它会给你一个完全复制的解决scheme的“即时恢复”,但以磁带forms的备用恢复方法。 这意味着你的直接存储成本翻了一番,但是你无法打败拥有热备件的时间。

如果热备份对于您的血液来说太丰富了,磁带的每GB成本仍然远低于磁盘的成本。 恢复需要更长的时间,需要很长时间才能完全恢复,但最终还是会得到您的帮助。

那么,没有“便宜”的方式去做这件事。

不过,我认为backblaze已经为你做了大部分的努力工作。 这里有一篇关于他们如何做的优秀文章。 http://blog.backblaze.com/2009/09/01/petabytes-on-a-budget-how-to-build-cheap-cloud-storage/

他们打开devise,有人正在销售你需要的所有东西,减去磁盘。 http://www.protocase.com/products/index.php?e=Backblaze

既然听起来不像是你回头去改变曾经存储过的东西,我会推荐磁带。 它需要强大的备份软件来pipe理,可以识别不好的媒体,但听起来你可以用硬件的方式很less摆脱。 一个双头库就足够了,这将允许您让备份服务器在每周增量之间进行后台回收。 每周300GB的单个LTO-5驱动器每周不到一个小时。

您可以指示软件准备一组要发送到场外的磁带以进行站点恢复。 这将避免在您的WAN上每周发送300GB的需求来进行某种复制。