带宽高效的软件RAID

我有这个疯狂的想法..如果我find我失踪的一块可能会工作

  • networking与40个窗口工作站(24小时)
  • 每台机器使用500 GB容量中的20 GB
  • 安装每个iStorageServer的免费副本
  • 为每个创buildiSCSI目标(400 GB x 40 = 16 TB原始存储
  • 在中央的Linux服务器设置软件RAID和LVM上,如果不超过1/3的工作站同时closures,则存储在线。 所以10TB存储

…最后一部分是至关重要的。 如果我使用普通的linux MDtypes的raid,所有的stream量都会在局域网上造成破坏。 但是必须有一些东西可以更加优雅地处理这个问题……如果它真的很聪明,它也可以处理优雅的退化……半数的离线工作场所? 没问题..看到一半的文件。 他们回来了网上..他们在那里。

顺便说一下,这不会被用于任何关键任务数据,高stream量数据…它可能会保存一些档案或备份的备份或者可能只是一个巨大的垃圾临时磁盘,需要放在某个地方时间。

…我有点希望通过发布这个,你会说“这已经存在了,它支持Windows工作站作为数据仓库”(我知道它已经存在于Linux上)

谢谢

这很难做到的原因很简单 – 考虑一下当一台机器长时间脱机后重新联机会发生什么。 其大部分数据已过时。 在这一点上,你有两个select:

1)你同步它。 但是这会给所有的机器和networking带来沉重的负担,直到机器恢复同步。 而数据将会在你尝试重新同步的时候发生变化,而性能会吸引一段时间。 谁知道,也许一旦你把机器同步起来,它就会被closures。

2)你不同步。 这避免了上面的问题。 但问题是你的冗余度会逐渐下降。 如果你击中魔术三分之一,你会炸毁,失败。

从概念上讲,问题是这样的:假设你有9台机器,你的devisescheme是可以用任何三台机器来恢复数据。 现在说你实际上只有三台机器,而且你还在使用。 您将累积只在这三台机器上的数据。 当第四台机器出现时,您处于一个脆弱的状态,如果刚刚出现的机器出现故障,您将丢失数据。 所以你必须快速同步,不pipe性能成本如何。

这并不是说这是一个坏主意。 这只对某些types的数据有用。 例如,备份很棒,因为它们不会改变。 而且你可以把新的信息放在当时正在使用的机器上。 暂时失去对备份的访问并不重要。