如何使用我们现有的mac专业人士作为分布式存储?

我在一个实验室工作,必须支持一些处理器密集型用户应用程序,但基本上不需要本地磁盘存储,因为我们不保证任何types的数据持久性。 然而,作为一个Mac商店,我们仍然购买标准的存储configurationMac专业版。 鉴于pipe理策略是继续购买比我们使用的磁盘容量更多的磁盘,有没有办法在这些磁盘上build立某种分布式文件存储?

理想情况下,它被用来存储用户主目录,但是,因为我们目前已经有15TB以上的空间了,所以我们很乐意去解决一个更容易延迟的应用程序,比如存储主目录的tarballs通过login挂钩进行下载和提取,甚至可以归档服务器备份。

要求:

  • 客户端(数据用户),节点(数据pipe理员)和任何可能的服务器(协调员?)软件都运行在Mac OS 10.5和更高版本
  • 高度容错:“节点”也是用户工作站,随时可能重新启动; 工作人员当然会采取任何必要的措施,让机器长时间维修或退休
  • 在商品硬件上运行:相当高端的商品硬件,但仍然是商品硬件,没有FibreChannel或SCSI

奖金:

  • 符合posix的:如果不像Hadoop那样,它会performance为一个普通的NFS挂载或者什么的

目前,MogileFS看起来是最好的候选者,Hadoop为了将来的支持而殴打它。 我也读过Gluster,但是我不知道比赛有什么区别。 任何意见,将不胜感激。 我意识到,在用户正在使用用户工作站时,将用户工作站作为存储节点是非常高的要求。

如果有人能告诉我应用程序被称为什么,我也很感激,因为维基百科声称“分布式文件系统”实际上是指NFS和BitTorrent(?!)之类的东西。

相关: 分布式,并行,容错文件系统 , 哪个分布式文件系统作为云计算的后端?

Gluster会做你想要的东西。 它甚至将文件存储为普通的系统文件,但使用它们的扩展属性来跟踪它们。 我已经在CentOS Linux上的一些相当重要的生产环境中使用过它,但是不知道MacOS上的支持是什么样的。 理论上,你可以从源代码编译…如果没有可用的二进制文件等