Articles of 集群

vmware工作站上的RHEL群集节点的护栏设备

我有一个Windows 7的主机。我安装了VMware Workstation,并安装了两台虚拟机。 每个虚拟机都是运行clusteruite的rhel 6.2节点。 你知道我可以使用哪个围栏设备来configuration群集吗?

Apache httpd主动/被动设置

我想在主动被动模式下设置Apache Web服务器来支持Redhat linux 5机器上的HTTP故障转移。 我明白可以使用heartbeat或keepalived在HA中设置2个Linux机器。 此外,RHEL还附带有用于networking负载平衡的补充包。 想知道 – 1.我需要做的任何其他考虑,以获得高度可用的网站2.什么是选项的利弊心跳,keepalived,RHEL包

MySQL集群是一个在5年内期待5TB数据的数据库的可行select吗?

我们计划实施MySQL Clustering。数据库应该支持5年的数据,预期的数据/年份是1TB。 当我们创build一个数据库大小为200GB的testing环境时,NDB群集花费了2个多小时才能重新启动。 对于5年内需要5TB数据的应用程序,MySQL Clustering是否是一个可行的select,如果是的话,请指导build议的体系结构和configuration。

不能WMI查询根\ MSCluster命名空间作为本地pipe理员

我正在尝试使用WMI Explorer查询各个主机上的根\ MSCluster命名空间以获取群集资源组和资源对象数据。 我可以访问Win2K3集群节点上没有问题的命名空间,但正在尝试连接到Win2K8和Win2K8R2节点时出现拒绝访问错误。 我可以访问root \ cimv2命名空间没有问题,只是MSCluster命名空间,即使我是本地pipe理员。 是否有一个function设置,本地安全策略或服务器angular色,我必须成为访问命名空间的成员? 谢谢!

使用SSH与克隆的CSS

刚刚有一个关于使用ClusterSSH(cssh)与我们内部用来连接远程机器的本地ssh-like / ssh-clone应用程序的简单问题。 我尝试使用$HOME/.csshrc或/etc/csshrc (甚至通过-C )传递ssh = /path/to/ssh_clone覆盖。 不幸的是,运行debuggingcssh显示它仍然试图连接到远程计算机,而不是ssh_clone -l user machine_ip 。 任何想法/build议如何解决这个将不胜感激。 TIA。 编辑:版本信息 $ cssh -v Version: 4.01_02

Open MPI无法通过SSH启动远程节点

我试图在networking上的几台机器之间build立Open MPI。 打开MPI在本地工作正常,但我不能让它在远程节点上工作。 我可以ssh进入远程机器(没有密码)就好了,但如果我尝试类似的东西 mpiexec -n 4 –host remote.host hello_c 那么SSH连接只是超时。 我查了几个教程,但他们给出的唯一的configuration说明是“确保你可以SSH密码进入远程机器”。 我做了,我仍然无法在远程机器上启动节点。 有什么问题?

CMAN:使用SBD(存储基于死亡)和看门狗作为STONITH

我正在build立一个基于CMAN + Pacemaker集群堆栈的双节点集群,但是我没有硬件STONITH设备。 但是,两个节点通过iSCSI连接到共享存储,我想用这个来用SBD进行屏蔽。 SBD由OpenAIS和Heartbeat支持,我已经使用了SBD和Heartbeat + Pacemaker集群堆栈,但是现在我需要使用CMAN。 因此,我已经添加了一些代码CMAN的初始化脚本来启动/停止SBD,它似乎工作正常。 关于看门狗:强烈build议使用看门狗运行SBD。 SBD是这种集群中的关键服务,并且必须在集群软件运行时始终运行。 看门狗有助于确保 – 如果由于某种原因,SBD过程意外终止,则狗不再受到喂食,并重新启动节点。 所以我在开始SBD之前就得到了看门狗内核模块softdog加载(就像在Heartbeat中)。 简单地说,我在/etc/init.d/cman中执行以下操作: 加载内核模块 – modprobe softdog 启动SBD – sbd -d <device> -D -W watch 这里是问题: 当我手动启动cman service cman start 一切正常,但是当cman在启动时自动启动,节点重新启动。 看起来好像看门狗没有被馈送,因为在SBD(14:21:29)初始化节点( <watchdog timeout> )之后,节点正好被隔离了<watchdog timeout>秒(5s),但是日志(/ var / log /系统日志)是有争议的,说SBD运行: Jan 15 14:21:28 cs-node1内核:[12.341755] softdog:软件看门狗定时器:0.08初始化。 soft_noboot = 0 soft_margin = 60秒soft_panic = 0(nowayout […]

XEN主机上运行多个虚拟机的OSPF

是否可以在XEN环境中设置OSPF区域来设置虚拟群集? 主要目的是避免外部路由器,因为所有的虚拟机将在同一台机器上运行。

Windows故障转移群集 – 向域用户委派权限以将组移动到另一个节点

是否有可能将权限分配给非pipe理员用户来监视和移动群集组? 有没有解决方法? 我对Windows Server 2008 R2和2012感兴趣。 我很喜欢从Windows Server 2008进行监视的只读访问。

RabbitMQ – 群集节点失败后意外的空的​​和未同步的队列

我已经下载并安装在Windows上的群集中的RabbitMQ: 在两台服务器(例如Alpha和Bravo)上下载并安装ERLANG和RABBITMQ, 安装pipe理插件,设置自定义的tcp_listener端口(增加安全性),并添加自定义的pipe理员login,而不是默认的访客:来宾login 在两台机器上设置相同的cookie(在C:\ Windows \和C:\ Users \用户名) 安装RabbitMQ作为Windows服务 将Bravo节点joinAlpha节点进行集群 添加策略来镜像所有队列(Pattern =“”,Definition =“ha-mode:all”) 我创build了持久的镜像队列并向其发布消息 – 它在两个节点之间同步(它可以正常工作) 但后来我试图testing如果closures一个节点会发生什么: 我closures节点布拉沃 我添加消息到Alpha节点 我在节点布拉沃回头 丢失的消息已同步到Bravo节点,但在pipe理控制台中,此节点被标记为“未同步” 这个队列有什么问题? 但还有其他问题。 例如: 我closures节点布拉沃 我添加消息到Alpha节点 我在Bravo节点上回头,等待消息同步 我closures了Alpha节点 我给Bravo节点添加了消息 我重新打开Alpha节点 队列中所有添加的消息神奇消失 这真是太奇怪了 有人知道发生了什么? 还有第三个testing用例: 我已经closuresAlpha节点,将消息添加到Bravo并closuresBravo节点 然后我打开Alpha节点,并收到消息“timeout_waiting_for_tables”。 我尝试了更多次。 它开始工作,只有当我也转身Alpha节点 也许我只是没有得到如何在RabbitMQ集群工作。 任何人都可以帮助我,并告诉发生了什么事?