分布式存储

在我的大学部门,我们即将升级我们学生实验室的电脑(约25-30台机器)。 这些机器将运行Linux。

关于新机器的一件事是他们有巨大的(1TB)硬盘(我们没有要求他们,但是现在你无法find相当便宜的硬盘!)

目前,用户主目录存储在中央文件服务器上,并通过nfs进行安装。

所以问题是,有什么办法可以使用所有这些磁盘容量? 我会想想

  • 扩大我们的中央文件存储,或
  • 复制主目录以加快访问速度。

主要问题是实验室机器不能保证一直运行。

浏览这个网站我读了关于GlusterFSAFS

GlusterFS似乎有很多朋友,是一个很好的通用解决scheme。

怎么样AFS? 我读过它有性能问题,有没有经验?

我去过那里,不想“浪费”好的存储空间。 这不是“好”,这是一个愚蠢的使命,试图使用该存储作为任何东西,但本地。 系统必须在每台机器上保留一份完整的副本,因为它永远不会知道打开/closures哪台机器。 单独的复制stream量会对您的networking造成显着的影响。

如果您真的想要使用这些磁盘,请将它们从工作站(PXE引导工作站)中取出,然后在SAN中使用磁盘(在SAN中使用消费级磁盘也有很多原因!)

你看过CEPH文件系统http://ceph.com/ceph-storage/

另外,关于caching,如果你真的想这样做 – 你可以尝试CacheFS,这里是关于http://www.c0t0d0s0.org/archives/4727-Less-known-Solaris-Features-CacheFS.html的好文章