为我的需求build立正确的系统

我将提供“文件托pipe”服务,我需要一些与我一起工作的东西,并允许项目扩展。 起初,我正在考虑一个采用RAID 5的大型服务器作为初创公司,但后来我认为使用多台服务器会更好,因为未来扩展容易,应该更便宜,但我完全不知道这些服务器应该/可以链接,如果多个服务器将作为一个单一的系统。

你能帮我解决一些想法和链接,关于将多个服务器连接在一起的信息,使它们作为一个系统运行,这样我就可以像处理一台服务器一样使用所有的处理器和磁盘空间+如果一台服务器崩溃了,其数据? 其他服务器能否正常工作?

对于服务器地理位置不同的位置,以及如何将文件从一个位置传递到另一个位置,我仍然有更多的疑问,但这不是现在的优先事项。

我已经在Google上阅读过这个function,但是他们正在使用他们自己的文件系统和其他一些不公开的function。

首先查看公共可用的分布式文件系统,如GlusterFS 。 像这样的系统可以为您提供冗余和缩放。

至于共享CPU的能力,你可以根据你如何提供文件来在多台机器间进行负载平衡请求。 像HAProxy这样的工具可以帮助解决这个问题。

在这种设置中,您将文件系统与文件的冗余副本链接起来,以便在节点脱机的情况下,不会丢失文件的可用性。 同样,HAProxy可以使几台不同的服务器显示为一台机器来处理请求。

您可能需要研究制作群集块设备(您可以将任何文件系统置于顶部)的DRDB 。

这个IBM开发人员工作文章提供了一个相当不错的系统概述 。 你的问题有足够的广度,你可以写一本关于这个话题的书,所以我认为我们所能做的就是让你开始。

http://www.gluster.org/about/

类似这样的任何使用你看起来像你可以build立自己的存储云从多个服务器,使升级等将更容易。 您可以在其他运行时closures节点并保持存储状态。

法案