Articles of 集群

如何在高可用性的辅助服务器上设置用户帐户?

在Windows Server 2012 R2上运行的Always On High Availabilityconfiguration中使用两台Microsoft SQL 2012服务器。 安装运行良好,故障转移几乎是完美的。 但是,连接到数据库(或本例中为高可用性群集)的软件正在使用必须映射到数据库的sql用户帐户。 我已经在主节点上创build了所述用户并将其映射到数据库。 在第二个节点上,我创build了相同的用户,但无法将其映射到数据库。 因此,发生故障转移时,数据库在技术上可用,但软件无法连接,因为用户未映射到第二个节点上的数据库。 我认为这是问题,因为我能够使用Windows身份validation故障转移后连接到高可用性。

什么围栏设备设置可以防止双节点RHEL群集中的互相STONITH?

我在具有iDRAC的物理Dell服务器上的RHEL 6.6上安装了Red Hat群集(corosync + rgmanager)软件。 这个群集用于无状态应用程序(stunnel,一个TLS网关),所以它不需要也没有任何共享磁盘。 我宁愿保持这个群集尽可能简单,所以我宁愿不添加任何iSCSI仲裁磁盘(到目前为止,根本没有qdisk)。 我的cluster.conf包含: <cman expected_votes="1" two_node="1"/> 如果我的“心跳”链接完全失败,我的testing强烈build议发生这种情况: 如果双节点集群中的两个节点彼此失去联系,是不是试图互相隔离? 他们是这样。 当每个节点认识到另一个已经停止响应时,它将尝试篱笆另一个。 它可以像OK Coral上的一场枪战,而且平局最快的节点(首先篱笆另一个)胜出。 不幸的是,两个节点最终可能同时下降,失去整个集群。 (引自https://fedorahosted.org/cluster/wiki/FAQ/CMAN ) 任何围栏设备能保证这种枪战只会closures一个节点吗? 当然iDRAC或vmWare代理不能防止这种情况。 我正在考虑一些只能按顺序执行的IPMIfunction的PDU,如下所示:如果存在closures端口的请求,则该请求将等待所有正在进行的closures其他请求。 我无法在PDU文档中validation这一点,但也许有人已经尝试过,可以推荐实际上以这种方式工作的东西。

如何做mysql / galera集群的自动故障切换

我有两个mysql / galera集群,每个有三个节点(两个+ garb节点)。 这些集群在独立的DC(dc1和dc2) 跨群集复制发生在node1-dc1和node1-dc2之间 我想知道如何在node1-dc1下降到node2-dc1的情况下自动进行故障切换。 我想另一个问题是:如果我可以编写脚本,是否会自动执行故障切换? 任何其他build议和最佳做法也是受欢迎的。 这是在node1-dc1和node1-dc2之间build立复制的方式 1 – 在每个节点上添加以下行到/etc/my.cnf文件并重新启动mysql服务 # vi /etc/my.cnf server-id=101 # 102 for the remote galera node log-slave-updates=1 log-bin=mysql-bin gtid_mode=ON enforce-gtid-consistency=1 2 – 在两个节点上向“replicant”用户添加授权 > GRANT REPLICATION SLAVE, REPLICATION CLIENT ON *.* TO replicant@'%' IDENTIFIED BY 'password'; 3 – 在两个节点上启动复制,将MASTER_HOST设置为另一个节点的IP地址 mysql> STOP SLAVE; mysql> CHANGE MASTER TO MASTER_HOST […]

如何使用Ubuntu同步群集的不同节点上的时钟和UID?

我是集群计算和Ubuntu的新手。 我们有一个带有4个节点的计算集群(每个节点10个核心)安装了Ubuntu。 该集群是为了科学计算。 要首先安装一个负载pipe理系统,我需要在所有节点上同步UID和时钟。 我不知道该怎么做。 有什么build议吗?

HAProxy可以在运行的同一节点上禁用Apache实例吗?

我有一个在核心i74xx上运行的三个虚拟机的设置。 这些机器与HAProxy组成一个LAMP集群来执行负载平衡。 运行多个负载testing后,我发现一旦将Apache实例与HAProxy运行在同一个节点上进入维护模式,吞吐量就会翻倍 – 因此,为HAProxy提供更多的CPU。 现在的问题是,两个HAProxy实例都运行在keepalived故障切换模式下。 人们永远不知道哪个节点运行HAProxy。 架构本身如下所示: 我不想增加更多的机器到集群,而是更有效地传播服务。 有没有办法用HAProxy自动pipe理Apache的状态?

无法在Windows Server 2012 R2中创build群集

我试图创build一个群集之间的两个networking/网关和validation是完全通过,之后,我得到错误 创build群集时发生错误,节点将被清理。 请等待…正如我在事件id中所看到的(在节点清理期间,群集pipe理的本地用户帐户未被删除,错误代码为'2221'。删除帐户。)在哪里我能够在本地networking中的同一台服务器上configuration群集

起搏器supervisord和资源组

对于环境和configuration请检查 (7):call = 53,status = complete,last-rc-change ='Mon Jul 13 07:51:32 2015',queued = 0ms,exec = 0ms 我现在添加一个由supervisord控制的服务所以我添加supervisord作为一个资源在PCconfiguration 问题是,在被动节点,我仍然可以启动supervisord,并保持运行,而我理解的正常行为是,电脑应该closures它。 其次,我需要所有的服务来转移到被动节点,即使其中一个死亡,我正在分散服务noda-a和节点-b。 什么是解决这个问题的最佳解决scheme,我在做什么错事?

集群红帽添加默认路由,不启用RIP协议

我们有几个红帽企业Linux服务器与群集 uname -a: Linux deda-ora1 2.6.18-194.el5 #1 SMP Mon Mar 29 22:10:29 EDT 2010 x86_64 x86_64 x86_64 GNU/Linux rpm -qf /etc/redhat-release enterprise-release-5-0.0.22 每个节点4个nic: eth0奴隶债券 eth2救济债券 eth1未使用 债券0掌握债券 ifconfig first node: bond0 Link encap:Ethernet HWaddr D8:D3:85:B5:B6:AE inet addr:172.19.19.65 Bcast:172.19.19.255 Mask:255.255.255.0 inet6 addr: fe80::dad3:85ff:feb5:b6ae/64 Scope:Link UP BROADCAST RUNNING MASTER MULTICAST MTU:1500 Metric:1 RX packets:62794748 errors:0 dropped:28 overruns:0 […]

试图让qsub在我的集群上工作

试图让qsub在我的集群上工作(现在单个节点,但更多的是)到目前为止,试图用qsub提交返回 error: commlib error: got select error (Connection refused) Unable to run job: unable to send message to qmaster using port 536 on host "nes.local": got send error. Exiting. 我在gridengine.org上关注了一些post,提示: /etc/init.d/sgemaster.nes start /etc/init.d/sgeexecd.nes start 自从现在qsub说这似乎已经取得了进展: Your job 4 ("some_job.qsub") has been submitted 但它永远保持悬而未决。 qhost -f返回: HOSTNAME ARCH NCPU LOAD MEMTOT MEMUSE SWAPTO SWAPUS ——————————————————————————- global […]

Opendaylight集群:解决artifactorg.jolokia错误:jolokia-osgi:jar:1.1.5:无法传输工件

我正在使用Karaf(0.4.1-Beryllium)的集成发行版本来部署带有Opendaylight Controller的3节点集群。 在使用deploy.py脚本并检查每个节点上的所有configuration文件都没有问题后,我在运行./karaf时遇到了karaf.log中的这个错误 | 事件调度程序| AetherBasedResolver | 3 – org.ops4j.pax.logging.pax-logging-api – 1.8.1 | 解决artifactorg.jolokia时出错:jolokia-osgi:jar:1.1.5:无法传输工件org.jolokia:jolokia-osgi:jar:1.1.5 from / to central( http://repo1.maven.org/maven2/ ):/ usr / share / maven / conf:… 任何build议将不胜感激,谢谢!