如何获得一个124 TB Isilon文件系统廉价的灾难恢复?

在我们的Isilon集群上,我们有一个124 TB的文件系统。 目前这个数字已经达到了38%,有3100万个文件。 大约一半的数据是图像文件,平均文件大小是1.5 MB。 我们使用快照来防止意外删除,但是我们需要不同的东西来防止完全失败(例如,系统pipe理员错误,软件错误,水,热或火灾损坏)。 而且因为我们是一个糟糕的研究实验室,所以不应该太昂贵。

我们目前试图备份到磁带,但有两个问题。 首先,只要遍历目录树,并说明每个文件需要五天以上的时间,所以即使是增量备份也要花费一个星期的时间。 其次,也是最重要的一点,恢复将需要数周甚至数月的时间。

理想情况下,我们希望在灾难发生一周内再次访问大部分数据。 (如果我们可以select首先恢复哪些目录,那么可以在几周内逐渐恢复数据,但是采购新的存储设备和恢复可能需要比这更长的时间。)我能想到恢复的唯一方法一个星期是在一个单独的位置维护磁盘上的复制​​。 可以丢失至less几天的工作,所以复制可能会滞后一些,或者在几天的时间内覆盖文件系统。 复制品的性能比原来差得多。

Isilon解决scheme将使用SyncIQ将文件系统复制到另一个群集。 因为它在块级别运行,所以避免了遍历文件系统和统计每个文件的问题。 可以预料的是,成本有点陡峭:SyncIQ软件的许可证是55000美元,然后昂贵的Isilon存储的成本同步(虽然使用更便宜的NL存储有点帮助)。 我预计Isilon的解决scheme将达到每TB500美元到1000美元之间,远远好于我们为主存储器支付的1300-1900美元/ TB,但对我们来说仍然是很多钱。

鉴于目前原始硬盘的价格可能达到60美元/ TB,我希望124TB的caching可以拼凑在一起,远低于Isilon的价格,而且有一种方法可以在一周内复制变化。 你能想出办法吗?

我在一个运行Isilon集群的商店工作; 我没有太多的触及,所以我不能说太多的细节。

但是,我们的方式,我们确实备份到磁带; 我们有一个磁带机器人,所以我们不必一直处理交换盒式磁带(我想这使得长时间的备份更容易)。我们也select了更昂贵的X系列Isilon节点,并且只获得了一堆; 是的,每个节点的存储更less,但也允许更多的容错失败。