Articles of 高可用性

HAProxy随机失败(后端没有服务器!)

我有一个CentOS 7.1(x64)液滴configuration为在2个Apache / PHP服务器之间进行负载平衡。 我有它完美的工作,但随机一整天报告如下: haproxy[12947]: backend app_backend has no server available! HA代理日志文件: Nov 5 [12947]: Server app_backend/web-live is DOWN, reason: Layer4 timeout, check duration: 2001ms. 0 active and 1 backup servers left. Running on backup. 11 sessions active, 0 requeued, 0 remaining in queue. Nov 5[12947]: Backup Server app_backend/web-backup is DOWN, reason: Layer4 timeout, […]

当一个节点失败时,gluster操作会挂起

我有3个节点gluster服务器。 从它的大部分坐骑是只读的,并像本地主机: mount -t glusterfs localhost:/volume /mnt/mountpoint/ -o ro 卷是复制3副本(每个节点上一块砖) 我已经configuration了音量选项,如: cluster.quorum-count: 1 cluster.quorum-type: fixed cluster.server-quorum-type: none 我期望一个节点的失败/重新启动不会中断从本地安装的卷的读取操作。 不幸的是 – 当我重新启动任何节点或任何节点失败 – 甚至像读取操作 ls -l /mnt/mountpoint/somefile 挂起,直到失败的节点启动或达到network.ping-timeout。 我已经尝试过目前的版本3.8。 有没有什么办法可以configurationglusterfs始终服务(本地!)内容,独立于失败的节点?

VM集群中的SQL Server AlwaysOn不需要吗?

我们有许多在Hyper-V中虚拟化的SQL Server实例,并参与了AlwaysOn组。 我不知道导致这种设置的决定背后的具体原因。 本周,我采访了15位pipe理人员到我们的新职位。 他们大多数有超过15年的经验。 当我问“在虚拟化环境中使用哪些工具来提高数据库的可用性?”时,他们都提出了VM集群的内部机制。 AlwaysOn真的是在我们的情况下矫枉过正?

哪个分布式文件系统实际上适合我的需求?

听我说 我在这里看到了这个问题(用不同的forms),也许我find的最好的问题在这里 ,但是我不认为这是重复的,因为问了这些问题之后已经有一段时间了,而且我的问题有它自己的细微差别可能有助于其他类似的情况。 请听我说。 背景 我的问题来自于有很多很棒的分布式文件系统,这些文件系统宣称它们很棒,但是我怀疑并不是所有这些都是我所需要的。 我已经看了这个很棒的列表,提供了什么可用的build议,我不知道哪一个适合我的需要。 用例 这个服务器的目的是为了保证我的数据安全并可用于一般用途。 我将使用它来存储我的个人备份,以及由Nextcloud,Gogs和我自己托pipe的其他数据存储和使用的数据。 我在找什么 我正在寻找一个分布式文件系统: 防止腐烂 有删除编码(或至less是数据重复,所以驱动器故障不会中断使用) 扩展能力 从1个服务器到更多 从2个硬盘到更多 可以通过保险丝连接 强大的API和易用性是很大的优点。 我目前的硬件 这可能不重要,但可能有助于提示实施。 我目前有一个树莓派,一个2 TB的硬盘和一个4 TB的硬盘。 我计划在不久的将来增加一个2TB的硬盘,在更远的将来会有更多的硬盘更多的服务器(现在资金紧张,大学生很差)。 我目前提出的解决scheme 我已经研究了很多,我觉得这有点过头了,但是到目前为止, 我认为,就灵活性而言,Ceph目前是我最好的select。 我的计划是将BTRFS放在驱动器上处理位错,然后将Ceph作为单个节点集群运行,以便以后扩展。 关于这将如何工作的问题 我有关于我的build议设置的一些具体问题: 我知道BTRFS可以防止点腐蚀,但这是默认的? 我需要什么来启用它? 我知道驱动器大小的不一致可能是一个问题(一个2TB,一个4TB),但它会工作,直到我得到另一个2TB的驱动器? 谢谢 我真的很感激你读这个:)

多个备份服务器如何在Nginx中工作?

对于backup指令,Nginx文档声明的最低限度是: 将服务器标记为备份服务器。 当主服务器不可用时,它将被传递请求。 如果您有多个备份并且主服务器出现故障,请问是否有一个备份指定了新的主服务器? 还是会Nginx之间的循环? 而且这是否也适用于TCP? 背景 : 我有一个主服务器和多个备份,但所有的连接应该总是去相同的主或备份。 有点像ip_hash负载均衡模式,除了它应该为所有的连接和客户端使用相同的服务器。

在次要心跳停止的情况下,已经是主服务器进程的意外启动

我有一个主动 – 被动的心跳集群与Apache,MySQL,ActiveMQ和DRBD。 今天,我想在辅助节点(node04)上执行硬件维护,所以在closures之前我停止了心跳服务。 然后,主节点(node03)从次节点(node04)收到关机通知。 此日志logging来自主节点:node03 heartbeat[4458]: 2010/03/08_08:52:56 info: Received shutdown notice from 'node04.companydomain.nl'. heartbeat[4458]: 2010/03/08_08:52:56 info: Resources being acquired from node04.companydomain.nl. harc[27522]: 2010/03/08_08:52:56 info: Running /etc/ha.d/rc.d/status status heartbeat[27523]: 2010/03/08_08:52:56 info: Local Resource acquisition completed. mach_down[27567]: 2010/03/08_08:52:56 info: /usr/share/heartbeat/mach_down: nice_failback: foreign resources acquired mach_down[27567]: 2010/03/08_08:52:56 info: mach_down takeover complete for node node04.companydomain.nl. heartbeat[4458]: 2010/03/08_08:52:56 info: […]

完全冗余,高可用性的iscsi SAN(由n台机器组成)与集群文件系统一起使用

基础设施如何可能是一个简短的例子: 4个服务器作为iSCSI目标,并且每个服务器都暴露1x2TB(每个服务器都有一个raid10用于存储,因此2TB的可用容量) 需要具有8TB(上面暴露的磁盘:4x2TB)磁盘的n台服务器,并发写入是必要的。 所有的服务器真的共享存储。 现在,如何实现? 我没有任何关于群集fs的偏好。 问候,帕特里克

负载平衡,webapp设置的高可用性

我们build立了一个特殊的兴趣社交networking,需要为webapp服务器设置适当的服务器设置。 我们已经为webapp 5物理服务器 (2xE5645CPU,24GB Ram,RAID,4xGbit NIC)提供服务,其中一个服务器需要为我们的移动访问者(iOS,Android)提供API。 我们的web应用程序需要PHP,APC,Memcached和MySQL。 此外,我们有4个更多的物理服务器(2xE5620,12 GB RAM,RAID,4x千兆网卡): 彗星推服务器(聊天的自定义服务器) 队列/邮件服务器(beanstalkd) 静态networking服务器(G-WANnetworking服务器),带有12x2TB的2xDAS(Raid 6总共40TB) 专门用于HTTPS的Apache web服务器(如果SSL受保护的页面将放置在LB集群上,此服务器也可用于LB群集,这是否更好?)。 一开始我们只想在LB / HA上安装webapp服务器,因为目前我们没有更多的服务器可用。 最后是一个低成本的服务器(X3430,4 GB Ram,RAID,2 Gbit NIC),用于监控所有硬件。 我们有2台HP Procurve 2900pipe理型48端口千兆交换机。 上述所有设备都保留在我们的networking中心机架中。 我们在所有服务器上使用RHEL 6。 我有很多想法,但是我不确定哪个是最好的方法。 我的方向是在两个盒子上安装HA Proxy和Apache webserver,在两个盒子上安装MySQL数据库服务器,并在API和Web服务上使用Apache和MySQL。 使用其中一台专用networking的交换机连接所有服务器并用于内部通信(MySQL,上传后的文件传输)。 将每个服务器的多个NIC端口连接到交换机是否有帮助? HA Proxy是我们案子的最佳方式吗? 或者在2或3盒上使用nginx会更好,并且使用它来进行负载均衡和服务PHP,并且对于HA部分有LVS或类似的东西? 我为所有的解决scheme开放,5 + 1服务器可以灵活使用。 谢谢你的帮助。 更新:经过更多的研究,我认为这将是很难find一个解决scheme有所有服务器HA。 我的设置的实际想法是: nginx作为负载均衡的代理(我将使用中规格框之一) 3私人networking上的Apachenetworking服务器 2私有网上的MySQL服务器主/从 在上面的解决scheme中,Apache Web服务器也将托pipe支付SSL站点,我不确定是否nginx可以处理这个不同的后端服务器的SSL证书。 更新2:我做了更多的研究,Redhat提供了一个基于LVS的负载平衡附加组件。 http://docs.redhat.com/docs/en-US/Red_Hat_Enterprise_Linux/6/html/Virtual_Server_Administration/ch-lvs-overview-VSA.html这个插件看起来不错,但我仍然不知道哪个方向是正确的一? 在前面使用nginx还是使用LVS或其他的更好? 有人告诉我,我可以使用现有的HP Procurve […]

Exchange&MS SQL高可用性

任何人都可以build议,当两台数据中心之间的MS交换和MS SQL服务器在一台服务器位于数据中心时,可以实现高可用性吗? 来自连接到DC1中的SQL Server的站点A的用户应该能够在DC1中断的情况下无缝地连接到DC2中的SQL服务器。 站点之间有一个三angular形之间的P2P链接,即SiteA连接到DC1和DC2。 DC1连接到运行OSPF的DC2。 我不是一个Windows的家伙,但我想我们可以在两个不同的数据中心的服务器之间build立一个SQL集群? 我可以使用任何第三方解决scheme来实现这一目标?

LDAP(389目录服务)和多主站起搏器

我试图设置一对LDAP服务器运行389(以前的Fedora DS)高可用性使用Pacemaker与浮动IP。 另外,389支持多主复制,其中一个节点上的所有更改都自动复制到一个或多个其他节点上。 我相当接近一切工作。 故障转移工作得很好。 而多主复制工作正常。 但是,我当前的Pacemakerconfiguration会停止非活动节点上的目录服务。 这意味着备份节点没有从其他节点接收复制数据。 build立起搏器的正确方法是什么? LDAP目录服务始终在两个节点上运行 浮动IP被分配给其中一个节点 如果主节点死亡或 LDAP服务停止在主服务器上运行,则会发生故障转移 最初,我的Pacemakerconfiguration如下所示: property stonith-enabled=false property no-quorum-policy=ignore rsc_defaults resource-stickiness=100 primitive elastic_ip lsb:elastic-ip op monitor interval="10s" primitive dirsrv lsb:dirsrv op monitor interval="10s" order dirsrv-after-eip inf: elastic_ip dirsrv colocation dirsrv-with-eip inf: dirsrv elastic_ip 然后我探索了使用Pacemaker 克隆 : property stonith-enabled=false property no-quorum-policy=ignore rsc_defaults resource-stickiness=100 primitive elastic_ip lsb:elastic-ip op […]