Articles of 高可用性

数据库的高可用性(DRBD + GFS)?

它是否像GFS上的MySQL(或任何其他关系数据库)一样工作(使用DRBD),并有多个节点读写数据? 如果是,提供高可用性数据库/应用程序设置的“最佳”方法是? RHEL(集群套件)是一个很好的方法来设置这个? (或者centos)

HAProxy救援? (多台机器与虚拟主机)

这更多的是“最佳做法”或“投入赞赏”的问题。 目前我们pipe理大约5个运行Nginx PHP网站的Web服务器(在两个DC中)。 计划是重新devise设置,以便从pipe理的angular度来看更易于pipe理。 一个服务器在另一个networking中的DC中,其余的在单个机架中。 我们有时必须将客户端网站从一台服务器移动到另一台服务器,我们希望允许某些客户端的冗余等,所以代理似乎是一个好开始,任何速度的提高是非常受欢迎的,HAProxy似乎是一个很好的候选人都。 我们现在的想法是把HAProxy制作成一台机器,这样我们就可以在任何地方redirect任何东西,看起来很聪明,可以让机器像CARP一样进行故障转移。 任何见解/意见,高度赞赏。

Rails应用程序的高可用性开源SQL数据库解决scheme

我正在研究Rails应用程序的高可用性数据库的主题。 我正在寻找基于开源的解决scheme。 目前我们的系统运行在一个应用程序主机+一个数据库主机,这意味着这两个任何一个下降我有麻烦。 我更喜欢这个configuration加倍,如果可能的话,在不同的网站上运行(但这不是要求)。 第一个想法是主动 – 主动复制,但似乎Postgresql在这方面很薄弱,MySQL也不稳固( http://www.mysqlperformanceblog.com/2007/03/15/mysql-myisam-active-active-clustering因为麻烦/ )。 我正在考虑一个VoltDB,这看起来像一个性感的话题,可以像Rails一样使用。 日志共享似乎是一个不错的主意,但我对这个概念很新,我想知道这种解决scheme的成本,以及如何。 MySQL将会使用它。 而且它排除了我猜想在两个不同的站点运行应用程序的任何方式。 我真的可以在这里使用一些技巧,所以随时提出问题,并提出解决scheme。 我将编辑这个post来添加任何必要的信息。

Windows Server Appfabriccaching和高可用性

我们正在将一个解决scheme转换为使用Windows Server Appfabric Caching的过程。 我们想知道: 你如何打开高可用性选项? 这样caching存储在多个服务器上。 高可用性选项仅在运行Windows Server Enterprise Edition时可用? 如果一台机器停机,需要多长时间才能接pipe?

可用性监测服务,检查间隔低

有哪些网站可以进行高频率的可用性监测? 例如每10秒。 我们需要testingHTTP服务的工作。 另外,如果执行这些工具的时间比平常要长,那么这些工具是否会返回警告?

是否有可能创buildWindows任务计划程序的多个实例?

我有一个双节点Windows故障转移群集,我已将群集中的任务计划程序运行到我的批处理应用程序。 但是,我有某些任务(备份,日志轮换等),需要在每个独立于群集的节点上每天运行。 有没有办法设置独立于群集运行的任务计划程序的第二个实例?

检查服务器是否存在,如果不是

可能重复: 你用什么工具来监视你的服务器? 我正在寻找服务器群的监控解决scheme。 它应该解决以下问题: 检测主机是否发生故障或活动,并尽可能检测主机是否真正发生故障,或者是否由于networking故障而无法访问主机 如果主机发生故障,请运行一个脚本(除了在服务器场中的其他主机上运行一些命令)

起搏器复杂的资源托pipe

我正在为主数据库和从属数据库开展一个起搏器项目,以执行基于IP的故障切换。 将有两个IP资源,一个用于主站,另一个用于需要一起移动的从站。 我意识到,我在下面标记的不是一个完整的解决scheme,但要求如下: ip_dbmaster只能在db1或db21上运行 ip_dbslave只能在dbslave1或dbslave2上运行 当ip_dbmaster在db1上时,ip_dbslave必须位于dbslave1上。 当ip_dbmaster在db2上时,ip_dbslave必须在dbslave2上 在ip_dbmaster和ip_dbslave运行之前,做一些“东西”(shell脚本的东西,一些扩展健康检查)。 只有在“stuff”成功的情况下才能迁移 除了资源迁移之外,与上述相同 这是我的基本configuration: node $id="75463ec2-702c-427b-965b-b7ffb7814008" db1 node $id="a1f2d612-2d9f-4872-bf24-024f5bece3ce" dbslave2 node $id="d1d42f67-e4f2-4c71-950f-07d94ac01f8d" dbslave1 node $id="f243d865-c1a1-4d52-9100-b0d36a08207c" db2 primitive ip_dbmaster ocf:heartbeat:IPaddr2 \ params ip="10.153.114.100" cidr_netmask="24" primitive ip_dbslave ocf:heartbeat:IPaddr2 \ params ip="10.153.114.101" cidr_netmask="24" location loc-ip-dbmaster-1 ip_dbmaster \ rule $id="loc-ip-dbmaster-1-rule" 200: #uname eq db1 location loc-ip-dbmaster-2 ip_dbmaster \ rule $id="loc-ip-dbmaster-2-rule" 0: #uname […]

SQL Server 2008高安全性:从数据丢失的angular度来看,是否可以进行防御性configuration?

我正在devise一个带有两个SQL服务器的SQL Server体系结构,并计划在两者之间实现数据库镜像。 我需要尽量减less服务器故障(不pipe原因)的数据丢失情况。 我正在研究没有自动故障转移的SQL Server 2008高安全模式。 只有一个操作数据库需要镜像,两个服务器将在同一个站点上。 在线文档指出,在这种模式下,当主服务器closures时,我可以强制镜像成为新的主体,但是有丢失数据的风险。 那么我的问题是,如果发生数据丢失(使其最小化),镜像的目的是什么?我能做些什么来消除(而不是最小化)这种损失? 有没有一种模式,主服务器在数据成功写入镜像之前不会提交数据? 此外,SQL服务器通常会被客户端应用程序访问,客户端应用程序将被configuration为按名称连接到某个服务器。 如果有数据库镜像,应该使用什么服务器名称来访问镜像,客户端是否应该知道镜像服务器的存在? 编辑:应支持以下scheme: 委托人closures – >客户端收到失败,我们得到通知,手动中断镜像,并使用镜像作为新的主体,然后build立一个新的镜子,同时在线。 镜像closures – >客户端收到失败,我们得到通知,手动打破镜像,并build立一个新的镜子,而在线。

如何使用AppScale

有一些维基解释如何安装和设置AppScale。 但是我没有发现任何与AppScale的广泛使用有关的东西。 我的意思是,如果发生重大停电,该怎么办? 如果节点崩溃,但可以重新启动并且可以工作:AppScale是否自动将其他节点缺less的内容复制到其中? 所以基本上,只要节点没有损坏,它是否需要从系统pipe理员的任何东西恢复工作? 如果节点崩溃并且死机:让我们想象一下NAS的networking故障,这个networking故障损坏了文件系统,这个节点所在的数据中心爆炸了,或者任何可能导致节点DEAD无法启动的事情…你能设置吗一个新的节点,将它添加到你的“集群”,它会自行复制一切? 系统pipe理员需要做什么才能使节点恢复工作(时间,复杂性等)? 有没有包含这些使用案例的文档?