Articles of 集群

哪个计算节点执行了Sun Grid Engine作业?

使用Sun Grid Engine来确定在哪个节点上执行计算任务的最简单方法是什么? qstat似乎只列出运行/排队作业

为小文件集群文件系统

我正在寻找一个分布式文件系统,我可以用它来存储大量的小文件(通常<1MB)。 我想得到的是: 2台服务器,它们自己安装并镜像数据 locking支持(在可达节点之间) 一个节点掉下来再回来之后的某种尽力而为的自动再同步 我的意思是重新同步,即使他们脑子有裂痕,我也可以对两台服务器进行读/写操作。 如果一个本地进程获得一个锁,如果另一个主机不可达,我也可以。 从重新同步开始,我只希望在一段时间之后获得一个文件级别的一致性视图 – 也就是说,如果在裂脑期间在两个节点上修改了文件x ,那么我们并不在乎他们再次join哪一个可用,只要因为它是完整文件,所以不是来自node1另一个块和来自node2另一个块。 有没有这样的解决scheme? 我看到,gluster有一些文件locking问题(即使在3.1)。 我也注意到,如果两个节点裂脑,OCFS2会惊慌失措。 还有什么其他的文件系统可以让我做我想要的?

Amazon EC2中的Jboss集群

我正在努力将需要在Amazon EC2上进行扩展的应用程序,但这对我来说是新的。 我开始阅读jboss集群以及如何使用多播创build新节点。 在阅读Amazon EC2及其Auto Scalingfunction时,我有点困惑,并且无法弄清楚是否需要处理在EC2上托pipe应用程序的Jboss集群,因为EC2的负载平衡器负责创build额外的实例并pipe理请求configuration。 任何帮助和指针在这方面将是有用的。

Linux-KVM和Ganeti – 帮助我理解/部署

希望用Ganeti构build一个小型(但未来的certificate) Linux-KVM集群 我开始使用2台HVM机器进行设置,每台机器都配有2个500GB SATA磁盘。 我已经学习了文档,并且对系统有一个公正的理解。 但是,某些事情仍然不清楚,我无法find直接的答案。 我希望一个更经验丰富的用户可以分享一些洞察力: 1.我应该在物理机上使用软件RAID1(镜像)吗? 我的机器目前没有硬件RAID控制器。 加内蒂指出,“DRBD是networking上的RAID1”。 某处声称旧文件build议不要使用软件突袭,但我无法证实这一点。 2.掌握集群中的故障切换/镜像scheme? 如果我正确理解DRBD的限制,则只能同步到另一个节点。 所以在我的情况下,我会使用: [box1]主&节点 [box2] master-candidate&node boxN崩溃后,我可以部署另一个盒子,希望通过标准的Ganeti命令修复/重build坠毁的盒子。 如果我添加一个box3到集群 – 我能用DRBD做什么? 是否应该部署一个热备份来恢复另一个完全失败的盒子? 这里我不理解这个原理。 3.我可以运行* BSD实例吗? 我能够在Linux-KVM上运行* BSD虚拟机,但Ganeti似乎只是Linux实例? 我已经看到Ganeti实例pipe理器在问题队列中提到了FreeBSD,但是我不确定我是否能够通过Ganeti部署* BSD实例? 没关系,如果手动工作涉及到设置它们,但是我不确定我可以在安装完这个实例后使用Ganeti的所有function。 4.“客户”的带外pipe理? 我已经看到了VNC选项和串行控制台选项,但是由于Ganeti声称是“侵入主机,因为它接pipe了SSH密钥pipe理”,所以我想知道是否可以向其他用户提供带外命令行pipe理(具有固定的命令ssh特定实例停止/开始等)。 还是Ganeti提供类似“单一实例所有者”的东西?

无法在PostgreSQL 9.0中创build集群

我试图在同一台Ubuntu / Debian机器上安装并运行PostgreSQL 9.0的多个集群。 Debian有一个名为“postgresql-common”的包来帮助pipe理数据库集群。 但是,该软件包的版本是8.4,当我尝试执行版本9.0的pg_createcluster命令时,它说 – “错误:无效的版本:9.0”。 有人可以帮我吗?

多个实例,多个文件?

好吧,这可能看起来像一个新手问题,但在这里。 我正在使用Amazon Web Services,并为2个EBS EC2实例相同的实例创build了Elastic Load Balancer。 我们将调用这些服务器A和服务器B.当主负载平衡器上的文件请求,我假设它平衡负载之间,并从服务器A或服务器B拉文件。现在,如果我想使对服务器A上的站点文件之一进行更改。然后,我是否必须对服务器B的文件进行相同的更改?

MSSQL企业集群 – 故障转移跟踪

在MSSQL Enterprise集群中,我可以find过去故障转移事件的日志(何时发生以及哪些实例被重新分配?)

如何正确设置iWARP? 最好在环回

iWARP是一种在TCP / IP之上进行远程直接内存访问(RDMA)的协议,因此它可以与以太网和其他networkingtypes(而不是Infiniband)协同工作。 它适用于许多标准的IB接口 – 例如IB动词,因此它非常透明。 我正在做一些IB动词编程(主要是为了了解它们如何更好地工作),如果我可以使用iWARP在我的环回接口上执行RDMA,那么我将非常方便,以便能够testing我的一些代码没有进入我们的IB连接集群。 🙂 但是我不知道如何设置“本地开发环境”:即使在服务器或networking接口上从头设置iWARP,也没有我知道的教程。 任何人都可以给我一个教程或指向正确的方向吗? 环境是在VirtualBox中运行的Fedora 16。

Linux HA – 最佳心跳硬件解决scheme

大家好,我会问任何人什么是最好的第2层介质在Linux中的心跳,以及如何最好的configuration。 更确切地说,我一直在考虑为此专用的网卡,但后来我认为,如果交换机发生故障,那么我将失去大部分集群和STONITH'BUM'的心跳连接! 以后可能会失去我的工作:) 通过vif将心跳分配到每个节点的主要NIC上听起来是合理的,但不知道这是否是最好的select(至less交换机在一定程度上是冗余的)。 是否有可能通过保税界面使用心跳,这听起来是合理的? 你有任何其他技巧/解决scheme?

将MySQL服务器/数据节点添加到数据库集群中,而无需重新启动mysql集群

我目前有MySQL集群和运行。 对于高可伸缩性,有一种方法可以包含mysql节点,数据节点或pipe理节点,而无需重新启动整个集群。 我希望了解它是如何实现的,或者是否有我可以阅读的文档。 我相信只有最新版本可以支持这个。 我正在运行NDB 7.0。 我知道我能够在线添加节点,但是它需要我执行滚动重启。 我可以采取什么其他方法来实现这一点,而无需在我的networking中重新启动?