那里有一个分布式SAN /存储系统吗?

像许多其他地方一样,我们要求用户不要将文件保存到本地机器上。 相反,我们鼓励将它们放在文件服务器上,以便其他人(具有适当的权限)可以使用它们,并且正确备份文件。

这样做的结果是,大多数用户都拥有大量空闲的大型硬盘驱动器。 现在是2010年。 当然有一个系统可以让你把这个空的空间变成一个虚拟的SAN或文档库吗?

我设想的是一个客户端程序,推送到与中央服务器协调的用户电脑上。 服务器就像普通的文件服务器一样查看用户,而不是保留整个文件内容,而只是logging了在各种用户PC中可以find这些文件的位置。 然后协调正确的客户端来提供文件请求。 客户端软件将能够直接响应这些请求,并且足够聪明以在本地caching最近的文件。 为了冗余,服务器可以确保文件被复制到多个PC,也许允许你在不同的位置定义组,以便整个存储库的一个实例存在于每个组中,以防止在一个build筑物中的灾难取消所有其他的。

显然,你不会在这里指出你的数据库服务器,但是对于更简单的事情,我看到几个优点:

  • 文件通常可以从较近的(或本地 )机器传送。
  • 分配networking连接,而不是在单个连接上拥挤所有文件传输
  • 磁盘空间会像您的公司一样自动增长。
  • 应该最终便宜一些,因为你不需要保留一组单独的磁盘

我也可以看到一些缺点:

  • 如果计算机在繁忙时期必须提供服务或接受大文件传输,则用户计算机性能会偶尔降低。
  • 写作必须在networking上多次传播(虽然我怀疑这不是一个真正的问题,因为阅读在大多数地方比写作更多)
  • 仍然需要偶尔发送一个完整的数据副本的方式,这将使它很难做差异

想象一下,这个云存储系统完全存在于您的企业局域网中,并利用您现有的用户设备。

我们旧的主要文件服务器将在2年左右退休,我正在考虑用小型SAN来取代它。 我们当前的文件服务器使用大约400GB的1TB份额。 由于我们的备份空间有限,我们只保持这样的小。 我希望扩大到至less4TB的可用空间,如果价格下降的话,我预计可能会更多。 我想这样的事情会更好。 作为一所学校,我们有一对电脑实验室可以离开,这对于为这样一个系统增加一些额外的冗余是完美的。

除了极less数例外,我们的用户正在填充不到40GB的120GB硬盘,这意味着我可以轻松地为每台机器预留65GB的存储空间。 随着250Gb硬盘新机的推出,这个数字还会增加,甚至很快就会变大。 在更换文件服务器的时候,考虑到我们的桌面更换计划,我希望这样的系统可以使用5TB的可用存储空间,甚至允许冗余和历史logging。

不幸的是,我能find的最接近的是Dienst ,这只是一个可追溯到1994年的论文。我在search中只是使用了错误的stream行语,还是真的不存在? 如果没有,我缺less一个很大的缺点吗?

    这听起来像你正在描述的AFS ,其中最常见的实现是OpenAFS 。 关键的OpenAFS概念在这里描述: http : //docs.openafs.org/UserGuide/ch01.html#HDRWQ3 。

    AFS是:

    • 分散式。 文件系统多台机器,但仍然使用统一的名称空间,因此分布式特性对客户端机器是透明的。
    • 多余的。 文件可以同时存在于多个服务器节点上,因此多个服务器节点的丢失不会导致任何数据的不可访问性。
    • 可扩展性。 显然有些“企业”实现跨多达25,000个节点。

    是的,当您正确使用集中式存储时,最终用户桌面系统中的大型磁盘将不幸使用。 好吧。 使用假设的桌面networking分布式NAS的一些缺点是:

    1. 它将不得不处理由用户机器脱机引起的退化。 有人今天没进来,他们的机器关了? 更好的希望那里的文件分发到打开的机器上。 有人今晚晚上工作,他们的机器是唯一的一个呢? 运气不好,对不起。 除非你把所有的东西都复制到一个真正的文件服务器 – 然后,你获得了什么?

    2. 一切都必须有好的encryption – 否则,老板的文件,其中包含他的计划兑现,或人力资源文件,显示每个人的薪水,复制到邮件文员的机器吉米。 他运行LimeWire。 看看这是怎么回事?

    像CleverSafe (同时具有开源和商业版本)可以做你想做的事情,但pipe理非常不可靠的节点可能是一个问题。 CleverSafe可以处理多个节点的中断,但对于使用桌面作为存储节点的节点而言,可能不够快。

    我认为,过去我读过的学术论文也有类似的解决scheme,但CleverSafe似乎是一个真正的工作产品,而不仅仅是一个原型。 该公司自2004年以来一直在。

    SANsymphony 7.0存储虚拟化软件

    以下全部来自他们的网站:

    主要特点

    独立于设备的虚拟磁盘池,同步镜像(HA),高速caching,asynchronous远程复制,自动精简configuration,自动分层,在线快照,无中断磁盘迁移,连续数据保护(CDP)

    访问types

    通过物理或虚拟SAN阻止磁盘I / O。 文件系统访问是通过底层Windows Server操作系统的NFS / CIFS协议提供的。 两种访问方式可以结合使用,以满足高可用性,统一存储(SAN / NAS)的要求。

    主机环境支持

    运行标准Windows操作系统(Windows Server 2000,2003,2008,Hyper-V,Windows XP,Windows 7),UNIX,HP-UX,Sun Solaris,IBM AIX,RedHat Linus,Suse Linux,Apple MacOs,VMware ESX / vSphere,Citrix XenServer,

    磁盘支持(后端)

    在Windows Server 2008上支持的任何内部驱动器,外部驱动器,外部磁盘arrays,JBOD,固态磁盘(SSD)和智能存储系统都可以连接到DataCore节点。 它们可能是直接连接的或SAN连接的。


    这就是你要的,是吗?

    我想到的最接近的是Google Googles MapReduce或免费的Hadoop替代scheme,但是这个devise可以扩展到petabyte领域,用于真正的大型Web应用程序。

    一般来说,你的情况并不是我真正想尝试的,因为我猜测pipe理机器的pipe理开销将远远超过你可能从中获得的任何好处。

    另外,我认为Windows(或任何其他操作系统)可能存在未知的问题,可能导致快速扩散蠕虫的漏洞,可能会在几分钟内将您的整个networking带走,无论如何,好的和安全的你的系统被configuration好了,它将把你所有的数据存储池都带走。

    除此之外,我不太确定客户端系统上的免费磁盘容量会不断增长,因为我猜测将来会有更多的应用程序将被移植到networking上,包括像办公应用程序甚至Photoshop这样的应用程序,这将导致对瘦客户端的重大推动(再次)。