Articles of 群集

群集激活由于cman服务而失败

我有一个50TB的SAN设备,它有两个分区。 其中一个分区是configuration为在两个节点之间共享的gfs2。 但是,我在将这个分区安装在一个节点上时遇到了问题,而在另一个节点上却没有。 当我尝试挂载它时,我得到了follwing错误, gfs_controld join connect error: error mounting lockproto lock_dlm 我认为它与cman有关,因为它说没有得到dbus连接,但是这个服务在另一个节点看起来很好。 以下是有问题的节点上cman服务的输出。 # systemctl status cman.service # cman.service – LSB: Starts and stops cman # Loaded: loaded (/etc/init.d/cman) # Active: active (running) since mån 2016-08-01 15:44:37 CEST; 1h 48min ago # CGroup: /system.slice/cman.service # ├─1512 corosync -f # ├─1563 fenced # └─1579 dlm_controld […]

MariaDB Galera节点上的CPU使用率较高

我已经使用Galera安装了3个集群mariaDB,用于使用haproxy进行负载平衡的Web服务。 群集工作很好,互相同步,但是当我的网站上的访问者达到3000个以上的用户时,每个节点的CPU都是峰到高。 top – 09:19:03 up 17:36, 1 user, load average: 3.58, 3.82, 3.85 Tasks: 169 total, 1 running, 168 sleeping, 0 stopped, 0 zombie %Cpu(s): 17.8 us, 3.5 sy, 0.0 ni, 77.5 id, 0.3 wa, 0.0 hi, 0.5 si, 0.6 st KiB Mem : 12300340 total, 9661112 free, 551008 used, 2088220 buff/cache KiB Swap: […]

stickysession不能在Apache和两个Glassfish实例中正常工作

我有两个应用程序在两个Glassfish实例中运行,我configuration我的Apache使用sticky session如下所示: ProxyPass / balancer://Appcluster/ stickysession=JSESSIONID 但是这并不是100%正确的,当客户端从App1转到App2时,它会改变一些实例。 我检查我的导航器中的cookies显示我这样的事情: 我在web.xml发现了另一个configuration,如下所示: <session-config> <session-timeout> 30 </session-timeout> <cookie-config> <path>/</path> </cookie-config> </session-config> 所以当我这样做这样的path,每件事情都很好,但它创造了一个新的上下文之间的每个导航这两个应用程序之间。 现在我configuration我的GlassFish并设置App1像一个默认的Web模块 ,这工作正常,上下文是一样的,服务器创build一个新的cookie像这样: 但是,当我尝试连接没有默认的Web模块 ,它使用两个实例。 你能否提出Apache和Glassfish的正确configuration以在集群环境中运行多个应用程序? 编辑 我通知了一些事情,所以当客户端从App1到App2和VS,每次创build一个新的cookie如下: +——-+—————————————-+ | APP | Cookie | +——-+—————————————-+—–+ | app1 | b5a1cd4befdc306f6e569d835b5e.instance2 | New | +——-+—————————————-+—–+ | app2 | b6caf890638a506216d625f7c82b.instance2 | New | +——-+—————————————-+—–+ | app1 | b6d1870ad8f3d044cc768b31e810.instance2 | New | […]

无法将共享添加到2012 R2文件服务器群集 – 找不到angular色名称

我正在尝试build立一个概念文件服务器集群的certificate,以确保它能满足我们的需求,然后再实施一个实时集群。 我已经build立了两个节点的集群,两个networking(一个用于集群和客户端(10.0.0.0),另一个集群只用于(10.1.0.0)),集群运行两个angular色(SOFS和普通FS)。 这些angular色在我的客户机所在的10.0.0.0networking上设置了静态IP地址。 SOFS的angular色似乎很好,因为我可以创build共享,浏览他们并添加/删除文件。 正常的FSangular色,但是,当我尝试添加一个文件共享,我收到错误消息,根据下面的截图。 正如你所看到的,当我从客户端机器上pingangular色名称时,返回静态IP。 我还在两个节点上做了ipconfig / flushdns,以防问题出在哪里。 这是暗示一个DNS问题? 我不明白为什么这样的情况下,DNS条目看起来是正确的angular色名称,并提供在angular色设置中分配的IP。

如何使用多个Web应用程序监视NLB群集?

我实际上是一名程序员,但最近我参与了一些系统pipe理工作,因为我相信实际的pipe理员可能不会对他们的工作感兴趣。 我相信他们正在使用WhatsupGold进行监控,即使我也听说过关于Tivoli的一些信息。 无论如何,我们有一个Windows Server 2008环境(很大的惊喜),在NLB集群中有3个Web服务器。 我们正在等待一个真正的负载均衡器,但是至less需要与NLB至less半年或更长时间。 在这些Web服务器上,我们有5个以上的ASP.NET Web应用程序,并且在每个应用程序上都有一个显示OK的页面,如果一切正常。 问题是,NLB不知道应用程序池是否closures,并且无论如何都愉快地发送数据,并且检查页面的监视工具可能最终在另一个服务器上显示出来, 这当然是不可接受的(即使他们似乎并不在意),所以我想知道一个有经验的pipe理员如何设置这个,所以我可以直接在一个特定的服务器上处理特定的Web应用程序? 谢谢。

SQL Server集群故障转移使数据库“怀疑”

我在服务器维护中,我升级了1个节点的BIOS和Windows更新,现在我试图将我们的数据库集群故障转移到被动更新的节点。 它失败了,但八个数据库中的两个最终“怀疑”。 这可能是因为Windows更新或BIOS更新? 编辑:我正在使用群集pipe理员的群集移动组命令。 当我把它移回来时,嫌疑人就会消失,一切正常。 这个问题只在一个节点上。

如何从Windows 2008故障转移群集中删除“额外”(不需要的)networking?

有一天,我们在双节点Windows 2008 / Exchange 2007 CCR群集的一个节点上发生了严重的崩溃,我尝试从头开始重build节点。 我用这个粗略的概述: http://edmckinzie.spaces.live.com/Blog/cns!687C72A5909E4230!508.entry?sa=641979772 问题:我们的集群最初只设置了每个主机一个网卡,因为Win2008支持这个网卡(没有专门的心跳网卡)。 当我将新安装的节点添加到集群时,它会显示两个集群networking“集群networking1”和2.现有节点的网卡已放置在一个集群networking中,而我的新安装已经在另一个networking中结束了。 我无法在GUI中的任何地方find每个物理网卡应该属于哪个群集networking,但是我知道我之前已经完成了这个任务。 时间在这一点上是至关重要的,所以我希望在这里有人在他们头顶上有答案。 感谢任何指针。 问候,特隆德·欣德内斯

在Windows 2003群集中运行Windows 2008 Server

我们使用2xWindows 2003 Server + 2x Windows 2003r2 Server运行群集。 现在我们要添加2个Windows 2008(r2?)服务器到故障转移群集。 那可能吗? 还是需要为所有群集节点使用相同的操作系统(2008/2003)? 谢谢

与非对称(非相同的硬件)SQL Server 2005 / Win 2003群集的经验

我相当擅长处理SQL Server集群; 我想知道人们是否有经验,无论是好的还是坏的,在一个SQL 2005集群中使用来自同一供应商的不同型号的服务器。 假设: 在双节点集群中,我还有一个更强大,更多的RAM,更多的shizzle盒子和一个不那么强大,更less的内存,更less的shizzle盒子绑在一起。 这些将是惠普DL380和580机(不是这应该重要) 我理解并自动化每个SQL实例的内存pipe理过程,所以当SQL实例故障转移时,不存在内存争用。 基本上我认为CLR proc将监视实例,并自我调节每个实例的内存大小,以便它们不会分页或跨步。 我得到这样的事实,如果它们共享一个“较小”的节点,实例可能会变得更慢,或者在内存压力下,这没关系。 业务可以在服务器问题场景中处理较慢的实例。 合理? 任何“陷阱”要留意? 更多信息10/28:使用testing集群进行一些实验我发现重新configuration最大/最小内存是可以的。提供实例还没有受到内存压力。 如果我用一个需要大量内存的巨大查询折磨系统,同时将内存分配调整为比正在使用的内存分配更小的值,那么可能会将实例从内存中运行出来,并使其停止并重新启动(不愉快的情况)。 错误日志中的许多丑陋的内存不足消息,崩溃,烧毁…这是一个极端的情况,但很高兴知道。 因此,似乎只是在启动实例时才设置它是非常安全的,因为启动脚本中显示“我在node1上,所以我的RAM设置是X,或者我在节点2上,所以它们是Y“,就像这样: HTTP://sqlblog.com/blogs/aaron_bertrand … 更新:我正在testing这里更详细描述的SQL Agent + PowerShell解决scheme。

我如何知道我是否正确设置networking负载平衡群集?

我正在开展一个networking会议,我们将要展示约12个video,总计约有一半演出。 由于所有的参与者都将一次观看(也是stream媒体/下载),build议我们build立一个服务器场。 所以我有4台服务器,我试图联网。 他们都运行微软的服务器2008年,我已经花了最后三天设置它们,现在,它已经完成,我想确保它已经准备好了。 所以我只想确定一切都按照我认为的方式进行。 做这个的最好方式是什么? 真的,我想确保在播放时间内将负载分割到服务器上。