Articles of failovercluster

双Linux NFS服务器故障切换 – nfsv4leastime / nfsv4gracetime

这里第一次发帖,希望我不会犯很多错误。 我有一个2 NFS服务器的设置。 他们使用corosync / pacemaker + drbd提供主动/被动nfs服务器。 Distro使用的是Ubuntu最新的LTS版本。 群集还提供一个浮动IP为客户端连接。 卷复制工作正常。 问题是在故障转移期间I / O操作等待大约90秒。 故障切换后(新机器已经升级为新主机)客户端上的tcpdump显示如下数据包: 回复ok 52 getattr错误:unk 10013 寻找错误10013和谷歌nfs引导我这个usenet的职位 所以我的锁保留到NFS服务器,只有90秒后,他们被释放。 我需要降低该参数(包含在/ proc),但是当我尝试 root@nfs-ha-1:/# ls -l /proc/fs/nfsd/nfsv4gracetime -rw——- 1 root root 0 Jan 31 11:00 /proc/fs/nfsd/nfsv4gracetime root@nfs-ha-1:/# cat /proc/fs/nfsd/nfsv4gracetime 90 root@nfs-ha-1:/# echo 1 > /proc/fs/nfsd/nfsv4gracetime bash: echo: write error: Device or resource busy root@nfs-ha-1:/# 所以我需要关于这个问题的进一步的信息,或者在这个文件上写一个方法。 […]

Windows故障转移群集 – 向域用户委派权限以将组移动到另一个节点

是否有可能将权限分配给非pipe理员用户来监视和移动群集组? 有没有解决方法? 我对Windows Server 2008 R2和2012感兴趣。 我很喜欢从Windows Server 2008进行监视的只读访问。

故障转移群集不会故障转移

我在2008r2上有一个主动 – 被动故障转移群集,SQL Server 2008群集在它上面。 我去维修失败,资源无法在任一节点联机。 一旦我重新启动了被动节点,我就能够在原来的主动节点上再次联机。 第二个节点恢复后,我可以成功故障转移到该节点并继续进行更新。 一个线索是LANnetworking资源突然失败的集群。 我确实设置了允许群集networking通信,并允许客户端连接。 第一个集群事件是失败的SQL IP地址,之后是在线sql服务失败,然后在原始活动节点上出现相同的两个故障。 还有什么关于我需要检查的configuration吗? 我不明白为什么它失败了,直到我重新启动被动节点。 在运行Windows更新之前,我已经重新启动了该节点。 那会有什么关系吗? 谢谢。

将Server 2008 R2升级到Server 2012,故障转移群集问题?

我有一个双节点故障转移群集,用于testing我们的一些Hyper-V自动化Powershell脚本。 我驱逐了节点2,以便能够升级到Server 2012 Datacenter。 升级似乎已经执行OK。 现在,当我login到节点2时,我不能再在PowerShell中执行“ipmo failoverclusters”。 我也可以不再定位故障转移群集pipe理器。 启动服务器pipe理器时,可以看到故障转移群集在本地服务器(即节点2)的“angular色和function”列表中列为function部件。 我的设置中是否有可能丢失的东西? 自升级以来,我还没有激活Windows,这可能是原因吗?

PowerShell的testing群集cmdlet:访问被拒绝。 HRESULT:0x80070005

我将两个hyper-v服务器join了一个域,并为它们添加了共享存储。 从我读的内容来看,我应该可以运行testing集群cmdlet来检查configuration,但是当我运行它时,会抛出拒绝访问错误。 我正在运行它作为域的默认pipe理员帐户。 PS C:\Users\administrator.LAB> test-cluster -Node 'hyperv-02','hyperv-01' test-cluster : Access is denied. (Exception from HRESULT: 0x80070005 (E_ACCESSDENIED)) At line:1 char:1 + test-cluster -Node 'hyperv-02','hyperv-01' + ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ + CategoryInfo : PermissionDenied: (:) [Test-Cluster], ClusterCmd letException + FullyQualifiedErrorId : UnauthorizedAccess,Microsoft.FailoverClusters.Po werShell.TestClusterCommand 这些都是2012 R2服务器核心安装。

无法在Hyper-V 2008R2群集上启动VM

我有一个2节点的Server 2008R2 Hyper-V群集。 他们在SAN上使用CSV。 我使用SCVMM来pipe理它们。 我们最近有几次崩溃导致了故障转移,导致虚拟机死亡,并在另一个节点上启动。 大多数情况下,这工作得很好。 在断电的一个时刻,两个节点都暂时无法访问SAN,CSV离线。 在故障转移群集pipe理器中将其联机工作,并且大多数虚拟机启动正常。 但是一台虚拟机将无法启动。 在SCVMM中,它显示为丢失。 在故障转移群集pipe理器中,它显示为脱机,“SCVMM主机名configuration”资源失败。 尝试启动失败的configuration资源,或将虚拟机移动到其他节点会导致5分钟的等待,然后出现错误“错误代码:0x80071714该组无法接受请求,因为它正在移动到另一个节点”。 除了上面的错误之外,在任一节点上似乎没有任何最近的故障转移群集或Windows事件日志中的相关日志。 在上周发生故障时,我可以在故障转移群集pipe理器中看到一些关键事件: 事件ID 21502:“SCVMM主机名configuration”无法向虚拟机pipe理服务注册虚拟机。 25分钟后,事件ID 1230:群集资源“SCVMM主机名configuration”(资源types,DLL“vmclusres.dll”)崩溃或死锁。 资源寄存子系统(RHS)进程现在将尝试终止,资源将被标记为在单独的监视器中运行。 那个重复了3次,相隔5分钟。 从那以后没有日志。 我查看了SAN上的文件。 所有这些似乎都是完整的。 XMLconfiguration文件似乎是有效的(一些研究表明这可能发生,如果XML文件被损坏)。 编辑:我也运行了集群validation报告。 除了失败的资源和一些预期的错误,它们无法在线testing磁盘时,一切都看起来不错。 我怎样才能让这个虚拟机再次运行?

如果服务器不可用,如何使Nginx能够立即启动504?

我把Nginx设置为一个基于cookie的粘性负载均衡器。 逻辑是: 如果cookie不在那里,请使用round-robbing从集群中select一个服务器。 如果该cookie存在,请转到与该cookie值关联的服务器。 服务器然后负责设置cookie。 我想补充的是这样的: 如果cookie存在,但服务器closures,则回退到select下一个可用服务器的循环步骤。 所以实际上我有负载平衡,并希望添加故障转移支持。 我设法通过error_page指令来实现这个function,但是它不能像我预期的那样工作。 问题: 504(和与之相关的回退)仅在30s超时后才会触发,即使服务器不可用。 所以我想要Nginx做什么是立即(当然,这意味着:当TCP连接失败)发射504(或任何其他错误,无所谓)。 这是我们在浏览器中可以看到的行为:如果我们在服务器closures时直接进入服务器,浏览器会立即告诉我们无法连接。 此外,Nginx似乎正在为502错误做这件事:如果我故意错误地configuration我的服务器,Nginx会立即触发502。 configuration (精简到基本): http { upstream my_cluster { server 192.168.73.210:1337; server 192.168.73.210:1338; } map $cookie_myCookie $http_sticky_backend { default 0; value1 192.168.73.210:1337; value2 192.168.73.210:1338; } server { listen 8080; location @fallback { proxy_pass http://my_cluster; } location / { error_page 504 = @fallback; # […]

如何在Coldfusion 10中使用SESSION复制设置群集?

我无法使用会话复制设置群集。 我已经成功地build立了一个粘滞会话的集群。 当用Googlesearch时,我发现了很多解释相同问题的链接 http://cfmlblog.adamcameron.me/2012/11/problem-with-session-replication-with.html https://forums.adobe.com/thread/1238702?start=0&tstart=0 是否取消select粘性会话自动启用会话复制? 但没有我在哪里得到解决scheme。 任何人解决这个问题?

多实例SQL Server 2012群集需要多less个MSDTC群集服务(如果有)?

我正在创build一个新的SQL Server 2012集群,运行在两个物理节点上(操作系统是Windows Server 2012 R2); 该集群将托pipe多个SQL Server实例; 确切的数字还没有定义,但至less会有3个。 我试图了解是否需要创build一个MSDTC集群服务,如果我需要不止一个; 到目前为止,似乎有四种可能的情况: 没有MSDTC群集服务; 这不再是必需的。 整个群集的单个MSDTC群集服务。 运行在同一群集组中的每个SQL Server实例的MSDTC群集服务。 运行在自己的群集组中的每个SQL Server实例的MSDTC群集服务。 文档有点不清楚实际的要求,有variuos文章和博客文章说一切,而其相反,有时甚至在同一时间 。 这个集群需要多less(如果有的话)MSDTC集群服务?

Windows故障转移群集 – 创build群集向导:创build群集时发生错误

我有两个相同的Windows Server 2008 R2服务器,我试图设置一个故障转移群集。 “validationconfiguration”通过,但实际的创build过程产生一个错误: An error occurred while creating the cluster. An error occurred creating cluster 'newcluster'. This operation returned because the timeout period expired 有人知道如何解决这个问题? 谢谢! 编辑#1: Create Cluster Cluster: NEWCLUSTER Node: server1.domain.local Node: server2.domain.local IP Address: 10.10.10.101 Started 12/11/2014 11:35:21 AM Completed 12/11/2014 11:38:25 AM Beginning to configure the cluster NEWCLUSTER. Initializing […]