集群服务器 Gind.cn

哪个计算节点执行了Sun Grid Engine作业？

使用Sun Grid Engine来确定在哪个节点上执行计算任务的最简单方法是什么？ qstat似乎只列出运行/排队作业

为小文件集群文件系统

我正在寻找一个分布式文件系统，我可以用它来存储大量的小文件（通常<1MB）。我想得到的是： 2台服务器，它们自己安装并镜像数据 locking支持（在可达节点之间）一个节点掉下来再回来之后的某种尽力而为的自动再同步我的意思是重新同步，即使他们脑子有裂痕，我也可以对两台服务器进行读/写操作。如果一个本地进程获得一个锁，如果另一个主机不可达，我也可以。从重新同步开始，我只希望在一段时间之后获得一个文件级别的一致性视图 – 也就是说，如果在裂脑期间在两个节点上修改了文件x ，那么我们并不在乎他们再次join哪一个可用，只要因为它是完整文件，所以不是来自node1另一个块和来自node2另一个块。有没有这样的解决scheme？我看到，gluster有一些文件locking问题（即使在3.1）。我也注意到，如果两个节点裂脑，OCFS2会惊慌失措。还有什么其他的文件系统可以让我做我想要的？

Amazon EC2中的Jboss集群

我正在努力将需要在Amazon EC2上进行扩展的应用程序，但这对我来说是新的。我开始阅读jboss集群以及如何使用多播创build新节点。在阅读Amazon EC2及其Auto Scalingfunction时，我有点困惑，并且无法弄清楚是否需要处理在EC2上托pipe应用程序的Jboss集群，因为EC2的负载平衡器负责创build额外的实例并pipe理请求configuration。任何帮助和指针在这方面将是有用的。

Linux-KVM和Ganeti – 帮助我理解/部署

希望用Ganeti构build一个小型（但未来的certificate） Linux-KVM集群我开始使用2台HVM机器进行设置，每台机器都配有2个500GB SATA磁盘。我已经学习了文档，并且对系统有一个公正的理解。但是，某些事情仍然不清楚，我无法find直接的答案。我希望一个更经验丰富的用户可以分享一些洞察力： 1.我应该在物理机上使用软件RAID1（镜像）吗？我的机器目前没有硬件RAID控制器。加内蒂指出，“DRBD是networking上的RAID1”。某处声称旧文件build议不要使用软件突袭，但我无法证实这一点。 2.掌握集群中的故障切换/镜像scheme？如果我正确理解DRBD的限制，则只能同步到另一个节点。所以在我的情况下，我会使用： [box1]主＆节点 [box2] master-candidate＆node boxN崩溃后，我可以部署另一个盒子，希望通过标准的Ganeti命令修复/重build坠毁的盒子。如果我添加一个box3到集群 – 我能用DRBD做什么？是否应该部署一个热备份来恢复另一个完全失败的盒子？这里我不理解这个原理。 3.我可以运行* BSD实例吗？我能够在Linux-KVM上运行* BSD虚拟机，但Ganeti似乎只是Linux实例？我已经看到Ganeti实例pipe理器在问题队列中提到了FreeBSD，但是我不确定我是否能够通过Ganeti部署* BSD实例？没关系，如果手动工作涉及到设置它们，但是我不确定我可以在安装完这个实例后使用Ganeti的所有function。 4.“客户”的带外pipe理？我已经看到了VNC选项和串行控制台选项，但是由于Ganeti声称是“侵入主机，因为它接pipe了SSH密钥pipe理”，所以我想知道是否可以向其他用户提供带外命令行pipe理（具有固定的命令ssh特定实例停止/开始等）。还是Ganeti提供类似“单一实例所有者”的东西？

无法在PostgreSQL 9.0中创build集群

我试图在同一台Ubuntu / Debian机器上安装并运行PostgreSQL 9.0的多个集群。 Debian有一个名为“postgresql-common”的包来帮助pipe理数据库集群。但是，该软件包的版本是8.4，当我尝试执行版本9.0的pg_createcluster命令时，它说 – “错误：无效的版本：9.0”。有人可以帮我吗？

多个实例，多个文件？

好吧，这可能看起来像一个新手问题，但在这里。我正在使用Amazon Web Services，并为2个EBS EC2实例相同的实例创build了Elastic Load Balancer。我们将调用这些服务器A和服务器B.当主负载平衡器上的文件请求，我假设它平衡负载之间，并从服务器A或服务器B拉文件。现在，如果我想使对服务器A上的站点文件之一进行更改。然后，我是否必须对服务器B的文件进行相同的更改？

MSSQL企业集群 – 故障转移跟踪

在MSSQL Enterprise集群中，我可以find过去故障转移事件的日志（何时发生以及哪些实例被重新分配？）

如何正确设置iWARP？最好在环回

iWARP是一种在TCP / IP之上进行远程直接内存访问（RDMA）的协议，因此它可以与以太网和其他networkingtypes（而不是Infiniband）协同工作。它适用于许多标准的IB接口 – 例如IB动词，因此它非常透明。我正在做一些IB动词编程（主要是为了了解它们如何更好地工作），如果我可以使用iWARP在我的环回接口上执行RDMA，那么我将非常方便，以便能够testing我的一些代码没有进入我们的IB连接集群。 🙂 但是我不知道如何设置“本地开发环境”：即使在服务器或networking接口上从头设置iWARP，也没有我知道的教程。任何人都可以给我一个教程或指向正确的方向吗？环境是在VirtualBox中运行的Fedora 16。

Linux HA – 最佳心跳硬件解决scheme

大家好，我会问任何人什么是最好的第2层介质在Linux中的心跳，以及如何最好的configuration。更确切地说，我一直在考虑为此专用的网卡，但后来我认为，如果交换机发生故障，那么我将失去大部分集群和STONITH'BUM'的心跳连接！以后可能会失去我的工作:) 通过vif将心跳分配到每个节点的主要NIC上听起来是合理的，但不知道这是否是最好的select（至less交换机在一定程度上是冗余的）。是否有可能通过保税界面使用心跳，这听起来是合理的？你有任何其他技巧/解决scheme？

将MySQL服务器/数据节点添加到数据库集群中，而无需重新启动mysql集群

我目前有MySQL集群和运行。对于高可伸缩性，有一种方法可以包含mysql节点，数据节点或pipe理节点，而无需重新启动整个集群。我希望了解它是如何实现的，或者是否有我可以阅读的文档。我相信只有最新版本可以支持这个。我正在运行NDB 7.0。我知道我能够在线添加节点，但是它需要我执行滚动重启。我可以采取什么其他方法来实现这一点，而无需在我的networking中重新启动？

Intereting Posts

linux redhat + hang +挂起的原因如何将Linux软件RAID移动到新机器上？ ACL用户更改写入权限 Windows Server 2008内存使用与SQL Server 2008？ Raidcachingconfigurationbuild议如何将目录移动到新安装的驱动器？ Apache通配符子域到尾目录 configurationIIS以为单个网站使用多个应用程序池 DHCP服务器检查 Ubuntu的12.04 – svn重新定位和系统重新启动 Arp攻击我的networking 在Ubuntu中的鼠标/触摸板切换 ssh_exchange_identification – deny.hosts阻止由于我的IP更改而导致的ssh访问 Hadoop HDFS备份和DR策略为什么我无法调整VMWhare vSphere Client中的某些虚拟厚磁盘的大小

Articles of 集群