分布式文件系统服务器 Gind.cn

卸载陈旧的glusterfs分区

我在几台Ubuntu服务器上使用glusterfs：其中两台正在复制模式下运行glusterfs服务器。没有任何明确的错误，glusterfs分区变得陈旧，当我尝试访问陈旧的分区时，系统显示这个错误： Transport endpoint is not connected 另外，当在父文件夹上运行ls -l时，我得到： d????????? ? ? ? ? ? myfolder 我尝试了所有types的命令，我可以find这个分区，但我无法完成： umount -l /path/to/mount/point umount -f /path/to/mount/point 此外，使用fuser命令来显示访问此文件夹的进程不起作用。卸载保险丝内核模块不能完成，因为从内核configuration可以看出，保险丝内置于内核而不是可加载模块。我在/boot/config-2.6.32-24-server发现了这一行 CONFIG_FUSE_FS=y 我留下了两个select：重新启动系统。创build另一个挂载点，如myfolder2，并使用sudo glusterfs -f /etc/glustefs/glusterfs.vol /path/to/folder2重新挂载。当然，我select了选项2。任何人都面临过这样的问题？任何人有这样一个更好的解决scheme？

容错networking访问异构环境（包括Windows）中的冗余存储？

我们正面临devise“挑战”，我们需要build立具有以下属性的存储解决scheme：我们需要的哈一个可扩展的存储后端在客户端的离线/断开操作来解决networking中断跨平台访问从肯定的Windows（可能是XP向上），可能是Linux的客户端访问后端集成了AD / LDAP（权限pipe理（用户/组pipe理，…））应该通过慢速WAN链路合理地工作另一个问题是，我们并不真正了解所有可能的用例，如果人们需要能够并发访问共享文件，或者他们只能访问自己的文件，那么可能的解决scheme需要考虑并发访问从用户的angular度来看，冲突pipe理将如何看待这种情况。这两年的博客文章总结了我在过去几天的研究中得到的印象，有很多目前的übercool项目实施（非Windows）群集PBaby blob存储解决scheme，但有没有一个支持断开连接的操作很好，本地化，但我希望我们已经错过了一个明显的解决scheme。我们已经尝试过了的OpenAFS 我们认为我们需要一个带有本地caching的分布式networking文件系统，并testing了一个星期的OpenAFS（作为目前唯一支持断开操作的“稳定的”DFS，似乎是一条路），但是有几个问题：这是一个真正的痛苦设置没有官方的RHEL / CentOS软件包 elrepo目前的稳定版本1.6.5.1的包随机在新鲜的安装上发生恐慌，这是绝对不行的 Windows支持（包括所需的Kerberos包）是神秘的。 1.6分支的当前客户端不能在Windows 8上运行，1.7是当前的客户端，但它只是随机崩溃。之后，我们甚至没有对XP和Windows 7进行testing。只能说，我们无法正常工作，整个设置如此不稳定和复杂，以至于不能用于生产。桑巴+联合由于OpenAFS是一个完整的灾难，并没有其他的DFS似乎支持断开连接的操作，我们去了一个更简单的想法，使用Unison将文件同步到Samba服务器。这具有以下优点：桑巴集成了AD; 这是一个痛苦，但可以做到。 Samba解决了从Windows远程访问存储的问题，但引入了另一个SPOF，并没有解决实际的存储问题。我们可以将Samba下的任何集群FS捆绑在一起，但这意味着我们需要一个HA Samba安装来维护高可用性，这可能会增加很多额外的复杂性。我依稀记得以前尝试用Samba实现冗余，而且我不能在服务器之间静静地进行故障切换。即使在线时，您也正在使用本地文件，如果仅在断开连接时触摸本地caching，将导致更多的冲突这不是自动的。我们不能期望用户定期使用（function性但不太漂亮的）GTK GUI手动同步他们的文件。我试图用Windows任务计划程序半自动化这个过程，但是你不能以令人满意的方式真正做到这一点。最重要的是，Unison的工作方式使得与Samba同步成本很高，所以恐怕它不能很好地扩展，甚至根本就不能扩展。 Samba +“脱机文件” 之后，我们变得有点绝望，给了Windows“离线文件”一个机会。我们认为拥有内置于操作系统的东西可以减lesspipe理工作，在工作不正常时帮助指责其他人，因为人们已经使用了这么多年，所以应该工作。对？错误。我们真的想要它的工作，但它不是。 30分钟复制文件和拔掉网线/禁用networking接口留给我们（无声！状态栏中的Windows资源pipe理器中只有一个很小的通知，如果点击它，它甚至不会打开同步中心！）服务器上的不可修复的文件（！）和甚至不应该是冲突的冲突。最后，我们有一个小文本文件成功同步，其他一切只是爆炸可怕。除此之外，还有其他问题： […]

分布在多个磁盘上的访问

我有一个相当大的应用程序，需要同时访问相当多的（300+）大文件，并通过同时读取它们来访问它们。如果所有的文件都放在一个磁盘上（如果我有一个足够大的磁盘），应用程序的执行速度就会变慢。为了解决这个问题，我将这些文件分布在几个物理磁盘和机器上，NFS安装分区并使用bash脚本创build大量的sym链接，这样所有的文件都显示在1个巨大的目录中。这可以提高执行速度，3个磁盘分割可以提高执行速度10倍以上。有没有人有一个不太麻烦的方式来设置这个build议？我担心的是，在RAID或Gluster中的条带化可能不会很好，因为任何一个文件都不需要高读取速度，但是总是需要大量的同时访问。

Samba是我的正确select吗？

我们有一个使用大量内容的分布式应用程序（所有types的文件）。有几个服务器需要访问内容。现在内容被冗余地存储在每个服务器上。但是这变得越来越难看。我们希望将内容存储在具有大型硬盘的单个存储实例中。然后，我们要从我们的每个服务器上挂载这个存储实例的文件系统。我想过使用NFS，但安全scheme似乎不适合。现在我正在看桑巴，但我不确定这是否是正确的select。所有的服务器都是Linux，Samba的主要目的是Windows / Linux环境。 Samba让我感兴趣的是用户级别的安全性。除安全外，另一个主要要求是性能。我们的服务器需要快速访问内容。这在局域网上尽可能快。桑巴是不错的select吗？还有什么其他的select？那么WebDAV呢？编辑：我需要做什么：我们有不同数量的服务器需要访问越来越多的文件。我们预计会变成几个结核病。我们称这些文件为“内容”。所有服务器都必须使用相同版本的内容。服务器需要对内容进行并发只读访问。内容相对较less更新。每周一次，每月一次，但可能会更频繁。现在可以在每台服务器上同步内容，但是在不久的将来这将会变成一件痛苦的事情。更新必须相当活泼。我们认为只需在一台服务器（存储服务器）上更新/同步内容，并让所有其他服务器将内容作为远程文件系统安装。祝一切顺利一月

GlusterFS vs Mogile vs其他？

我一直在看GlusterFS和MogileFS（Ceph和BTRFS对我来说是不可用的，因为它们似乎还没有准备好）。我正在开发一个文件共享的Web应用程序，它将存储和检索分布式文件系统中的文件。它看起来像是 Web应用程序服务器处理puts / gets Web应用程序服务器查询DB服务器的文件位置/或插入新文件的详细信息，并获得一个宽敞的文件服务器地址 Web应用程序服务器从DB服务器的指定文件位置检索文件/从数据库服务器上传到给定文件服务器我在GlustFS和MogileFS之间为后端存储做了很多的工作。 GlusterFS是我最初的select，虽然我仍然阅读它，因为我以前没有使用它（虽然看不出有什么问题！）。但是，对于通过HTTP进行文件共享的特定目的，我曾经听说过几次MogileFS最适合这样的目的（尽pipe如此，我从来没有使用过MogileFS）。任何人都可以评论这样的应用程序，为什么一个可能比另一个更好？（在这里，更好的方法是：更可扩展，更高效，更好的I / O，更容易pipe理，更好的Linux支持，更好的监控和报告，这些点）。

故障保护RAM驱动器解决scheme

我正在寻找一个生产解决scheme来创build一个RAM驱动器，将安全地与硬盘同步。我有一个负载很重的I / O负载的定制软件（这是一些专有的面向文档的数据库），我需要大幅提高速度。我不能修改或摆脱软件本身，所以必须做水平或垂直缩放。该软件不支持框的水平侦察，所以我首先看垂直缩放。主要思想很简单 – 我们购买大量的RAM（96GB），并把整个东西放到RAM驱动器上。但它需要是安全的，丢失服务器上的任何数据重新启动不是一个选项。所以我正在寻找解决scheme，将保持RAM驱动器和硬盘之间的透明同步。肮脏的解决scheme，如通过bash脚本复制文件不是一个选项，需要更可靠的东西。在理论上我看到，像这里描述的某种分布式FS可以以一种奇怪的方式使用 – 在同一台机器上同步两个分区。但我怀疑这是否会在实践中起作用，而且从来没有尝试过。那么，有没有准备好的解决scheme的RAM驱动器透明同步到硬盘的想法？数据UPD：我需要在RAM中保存的估计数据量大约为50GB。服务器专用HP DL320,8 CPU，16GB RAM（最大96GB）。 I / Oconfiguration文件类似于数据库应用程序 – 大量的随机读取读取，较less的写入。

有没有无服务器的分布式文件系统？

类似于那里有分布式SAN /存储系统吗？或分布式冗余存储解决scheme 除了两个关键的区别（两年更新）。上下文：我有一个小型的Rocks集群（几十台不同function的机器），并希望让我的所有节点都集中其多余的存储空间以允许分布式文件系统。我也许可以腾出一台机器作为它的服务器，但不愿意。与上述不同的是，所有这些机器共享用户列表，并且没有用户可以获得根安全性，并且encryption问题几乎可以忽略不计。（FS以root身份挂载;每个用户使用perms包含一个目录）我觉得应该很容易做，我找不到任何解决scheme，比我所期望的更复杂。编辑：我的动机是，每隔一段时间，一个大的IO负载命中，取下NFS。我很清楚“用一堆SSD去购买一个不错的SAN”是一个相当不错的解决scheme。现在还没有 – 我想知道我能用软件和硬件做些什么。

密集读写的分布式文件系统的select

我有一系列服务器（HP ProLiant，34台服务器），每台服务器都有500 G的硬盘空间。这些服务器是计算集群的一部分，运行的进程大致分为两个“阶段”：阶段1：读取less量大（高达6Gb）的文件，并写入相对较大（高达1-2Gb）的文件。阶段2：读写大量（数百个）小文件，然后将其合并成更大的文件; 这些文件也随着作为“事务点”的临时文件一起生成。服务器不共享相同的机箱，并通过Gbit以太网连接。根据我之前的问题，我最初在一台服务器上放置了一个NFS共享，但是并发性水平导致了可用性和locking问题，因此经常在第二阶段导致进程失败。现在，我可以使用服务器中的磁盘，我想过使用分布式文件系统。我的初始方法（用于感谢其他地方的成功testing）是使用GlusterFS（分布式+复制安装）。然而，虽然它在第一阶段完美运行，但是由于networking中的延迟不足以处理池中所有服务器的所有这些并发读取和写入，导致各种服务器不同步，因此怪异的错误（缺less文件，奇怪的权限拒绝错误…）错误。此外，“问题”是服务器本身（或其中的一部分，我不需要全部使用）需要运行计算和提供存储（这是一个捐赠的资源，所以我不能做超过那）。所有这些都解释了用例，然后提示这个问题：什么是最好的分布式文件系统来处理“第二阶段”？请注意，我需要文件级别的东西，例如装入点或虚拟设备。

你可以用目录中的现有数据创build一个glusterfs吗？

我正在考虑将单个服务器/压缩文件转换为glusterfs分布式系统的开始。我已经在24TB RAID的服务器上安装了一个目录。我想使用这个初始的计算机来设置这个卷/目录glusterfs，然后不久后添加额外的砖块/计算机。我不确定我是否可以使用已经有文件的卷/目录。

如何在EC2 Amazon Linux AMI上安装ceph

我想在从Amazon Linux AMI（amzn-ami-2011.09.2.x86_64-ebs）派生的一些EC2主机上testingCeph （分布式networking存储和文件系统）。内核版本是3.2，启用了btrfs。但是与Ceph相关的内核configuration选项（CONFIG_CEPH_FS和CONFIG_BLK_DEV_RBD）似乎被禁用。我必须做一个新的内核，并注册到亚马逊？或者，有人知道更简单的方法吗？

Intereting Posts

WSUS报告批准为一个小组我怎样才能看到Nginx编译的标志？ Sql Server 2008 – 无法连接到本地默认实例是否有可能“皮条客”腻子自动生成日志，并运行多个会话在一个窗口（类似的Linux“terminal”）？大容量内存使用，缓冲区，没有应用程序启动如何加速存储arrays之间的文件传输？禁用特定用户的SSH密码login PowerEdge CS24-VSS的BIOS更新在cron邮编不起作用，但从命令拉链工作 Azure SQL数据库故障转移，但使用相同的DNS名称 iptables规则来防止IP欺骗如何访问托pipe在专用服务器上的过期域名网站，而无需进行任何configuration 如何处理Invision电源板（IPB）论坛垃圾邮件发送者？接入点 – 我应该能够连接到它，即使它没有连接到networking SMH不工作Proliant – 如何使用HPSUM？

Articles of 分布式文件系统