Articles of glusterfs

利用快照向外扩展分布式存储

我知道有很多类似的问题,有几个很好的答案。 尽pipe如此,我仍然没有find所需的东西:支持快照的分布式,横向扩展FS。 Gluster与完成快照支持将是伟大的,但他们似乎仍然在这个概念阶段… 该系统应该能够从20-40TB到100TB以上的多个步骤进行扩展,并且理想情况下是自由许可和开源的。 我对商业解决scheme有点感兴趣,如果它们很实惠(硬件的完整解决scheme可能不在图中)。 GPFS听起来很有趣。 重要: 快照! 高可用性 商品或标准服务器硬件(无Infiniband或FibreChannel) 在POSIX系统上运行 不那么重要: 数据局部性意识 性能(包括吞吐量和延迟) POSIX合规性(ACL,权限,…) 我曾经考虑过在ZFS中使用Gluster作为砖块,并简单地在砖块上进行快照,但是我怀疑这会在Gluster层次上产生可用的快照。 我的另一个考虑就是在Ceph块设备上使用ZFS,并有可能遇到诸如https://github.com/zfsonlinux/spl/issues/241之类的问题,并且性能可能不好。 我也担心ZFS远离实际的硬件。 有没有人有这样的设置经验?

限制HP P420i中的RAIDarrays数量

在P420i HP raid控制器的规格表上,它表示最大数量的逻辑驱动器是64个512 MB高速caching或更高。 但是,可以创build的数组数量的限制是多less。 例如,如果我有一个有24个SFF SAS磁盘的服务器,并且我希望我的操作系统能够看到24个独立的磁盘,而没有任何RAID或..因为我被迫使用控制器,与RAID 0(我知道这是没有道理的)比,我可以有24个不同的arrays,每个arrays中有1个逻辑驱动器?

对于不断增长的网站,推荐使用什么GlusterFSconfiguration?

我有一个网站,平均每天点击量达到5000万次,在接下来的3个月内,每天的点击量将超过1亿次。 我们正在尝试使用GlusterFS v 3.0.0(截至2010年1月17日) 目前,我们刚刚升级到负载平衡器环境,有3台物理主机和6台Xen-Server 5.5u1虚拟机(每台主机上有2台虚拟机)为网页stream量提供服务。 每台机器有6个Raid-6本地存储驱动器(7200RPM-SATA)。 我们来自的旧机器有一个镜像SAS 10K驱动器。 我们还build立了GlusterFS目前有3块砖,每个主机上有一块砖,它为6个虚拟机作为客户端提供服务。 在testing中,一切似乎都很好。 但是当我们投入生产的时候,似乎没有足够的I / O来提供超过15M的点击量。 几个星期前,我们的旧服务器能够处理stream量,最高可达20M。 有没有推荐的configuration这样的应用程序,或者要知道的事情是不明显的,他们的文档在gluster.org为我们的大小的网站?

亚马逊ec2内部IP地址更改时,连接丢失到glustferfs

我的网站运行在EC2实例上。 Web服务器将dynamic数据存储在glusterfs服务器中。 当glusterfs实例重新启动时,它们的IP地址会发生变化,所以Web服务器将失去与glusterfs的连接。 我怎么能解决这个问题?

GlusterFS权限在Linux上如何工作?

我正在放置一个水平缩放的Apache / GluserFS设置。 我试图弄清楚Gluster如何处理权限。 我将要有几个主机读写Gluster文件系统。 我了解Linux文件系统权限(ugo / rwe)的基础知识。 我想给一个用户(实际上每个主机一个用户)一定的文件系统权限。 基本上,我想给每个主机上的www-data用户(只有www-data)在GlusterFS支持的Web目录树上读写权限。 这可能吗? Gluster文件权限是基于名称还是用户标识?

在虚拟机内部安装Gluster,或者在Gluster之上build立虚拟机?

我正在build立一个高可用性,无共享的地理分布式Web服务器, 为其域使用多个Alogging 。 现在我更关心高可用性 – “当我拔掉任何一个电源线,每个浏览器仍然可以看到我的网站” – 比速度。 Web服务器软件在每个物理盒子的一个虚拟机内运行。 (是否真的很重要,我正在使用哪个Web服务器和pipe理程序?如果是这样,我目前正在使用Apache和VirtualBox) 有人build议我倾倒我打算用于保持Web服务器同步的当前复杂的本土系统,并用Glusterreplace它。 哪一个更好? 让主机操作系统仅运行虚拟机pipe理程序,并仅存储虚拟机磁盘映像。 在每个虚拟机中,安装Gluster软件,在虚拟机磁盘映像中的某个文件夹(砖块)处设置一个GlusterFS挂载点,并使用该挂载点(或其中的文件夹)作为Web根目录。 让主机操作系统仅运行虚拟机pipe理程序,并存储虚拟机映像,并单独存储允许虚拟机访问的文件夹(块)。 在每个虚拟机中,安装Gluster软件,设置一个指向虚拟机磁盘映像外的块的GlusterFS挂载点,并使用该挂载点(或其中的文件夹)作为Web根目录。 让主机操作系统运行pipe理程序和Gluster。 在主机操作系统上,将GlusterFS挂载点设置为指向实际物理磁盘上某个文件夹(块)的其他位置。 允许虚拟机作为Web根目录访问GlusterFS挂载点。 (无需在虚拟机中安装Gluster软件)。 让主机操作系统运行pipe理程序和Gluster。 在主机操作系统上,将GlusterFS挂载点设置为指向实际物理磁盘上某个文件夹(块)的其他位置。 由于两个Web服务器应该是相同的,请告诉pipe理程序将虚拟磁盘映像存储在GlusterFS挂载点内。 别的东西? 我怀疑一个比我更了解Gluster的人可以立即说:“如果你做了#4,(会发生一些可怕的事情)和(某些其他的数字)原因(其他一些可怕的事情)…所以唯一的select是其实作品是(唯一剩下的数字)“。 (也就是说,我不认为这是一个主观的问题)。 ( 有人可以解释这个GlusterFS设置的“优化”可以适用于任何这些替代品)。

GlusterFS作为弹性文件存储?

有没有办法在复制模式下运行GlusterFS,但是能够dynamic缩放音量? 假设你有3台服务器都在运行。 你的Gluster量将不得不与副本3设置 gluster volume create test-volume replica 3 192.168.0.150:/test-volume 192.168.0.151:/test-volume 192.168.0.152:/test-volume 然后你可以像\ mnt \ gfs_test那样挂载它 当我想要添加2台服务器到存储池,然后在这个卷中使用它们时会发生什么? 有没有简单的方法来扩大和增加副本数量为5? 我的最终目标是在EC2实例上运行,比如3个Apache前端,在gluster卷装上安装webroot。 我担心的是,如果我需要启动服务器,我希望服务器不仅是一个额外的Apache前端,而且也是gluster文件系统中的另一个服务器,增加了容错能力以及可能的轻微提高读取速度。 也许有更好的select,这将符合法案在这里? 谢谢。

pipe理程序和GlusterFS(或类似)在同一台物理主机上?

我从一个失败的项目中inheritance了一堆硬件。 他们是SuperMicro 2U服务器,配有24x SATA硬盘或固态硬盘。 我负责将这个通用硬件机架变成一个IaaS集群。 我是一个Xen的老手,KVM对我们来说这个bug已经被修复了,所以我很好的从大多数方面去了。 仔细查看文档,我不能确定现在是否可以在与VM主机相同的硬件上运行GlusterFS(或Nimbus / Cumulus或其他云存储层)。 我试图找出是否有人有这种configuration的经验 – 因为我没有单独的存储节点,我可以充分利用这个硬件吗? 任何其他build议的解决scheme,如在每个节点上的硬件直通到专用的存储虚拟机?

我怎样才能修复与gluster自我愈合目录总大小

我构build了一个glusterfs集群,types是带有4个服务器的条带复制卷: Volume Name: test-volume Type: Striped-Replicate Volume ID: bdb596e6-a7d2-44a4-8791-1b4fdc57469c Status: Started Number of Bricks: 1 x 2 x 2 = 4 Transport-type: tcp Bricks: Brick1: 10.90.245.18:/exp1 Brick2: 10.90.245.35:/exp2 Brick3: 10.90.245.36:/exp3 Brick4: 10.90.245.37:/exp4 我从一个客户端挂载它,同时上传一个100G的文件到testing卷。 服务器上的每个文件应该是50G。 当我上传数据到集群时,我closures了一个集群服务器。 当客户端完成上传文件,然后启动服务器,并启动服务glusterd。 然后像这样的luslus音量治疗信息: root@alyrokif:/exp1# gluster volume heal test-volume info Gathering Heal info on volume test-volume has been successful Brick 10.90.245.18:/exp1 Number […]

自动缩放Gluster群集

我试图configuration一个服务器自动启动并join复制集群的概念certificate。 当服务器不再需要时,它将被closures,并自动从群集中删除。 没有办法预先定义IP地址,也没有办法控制哪些服务器在需要更less的服务器时被closures。 (亚马逊自动缩放) 如何让服务器发现并join已经存在的Gluster群集? 我正在考虑运行一个cron作业@reboot,它探测networking,看是否有任何服务器在线运行Gluster,然后SSH进入find的第一个执行必要的命令。 问题是我似乎无法find成功探测networking的方法。 为了使自动关机成为一个问题,我正在考虑在每个集群对等设备上运行一个cron作业,检查是否存在任何断开连接的对等设备,如果发现有连接的对等设备,请将其删除。 这似乎相当复杂。 有没有更好的/更清洁的方式来做到这一点? 我对GlusterFS颇为陌生。 任何提示和指针是受欢迎的。