Articles of 高可用性

高可用性DNS托pipe策略?

我试图find一些方法来做一些现有的网站高可用性DNS托pipe的选项。 今天早上,我工作的公司因为我们通过我们的注册商( bulkregister.com )为域名提供的DNS托pipe服务而倒闭了。 现在我正在负责寻找一种不会让我们受到单个DNS提供者的束缚的替代scheme。 我们在寻找什么: 没有单点故障。 时间有效。 一个build议的解决scheme是做多个DNS主机。 这似乎是一个很好的select,但是我们有超过20个域名,并且在两个提供商的所有这些域名上更新IP地址是令人望而却步的。 成本效益。 我必须把这个卖给高层pipe理人员。 快乐就是我。 那么有什么方法可以支持呢? 我本人更像一个程序员,但是他们已经把这个任务交给了我,所以我想要得到比我更有经验的人的意见。

如何在双节点主动/被动Linux HA起搏器集群中设置STONITH?

我正在尝试使用corosync和pacemaker设置一个主动/被动(2个节点)的Linux-HA集群来启动并运行PostgreSQL数据库。 它通过DRBD和一个服务IP工作。 如果node1发生故障,node2应该接pipe。 如果PG在节点2上运行,则失败。 一切正常,除了STONITH的东西。 节点之间是一个专用的HA连接(10.10.10.X),所以我有以下接口configuration: eth0 eth1 host 10.10.10.251 172.10.10.1 node1 10.10.10.252 172.10.10.2 node2 Stonith已启用,并正在使用ssh代理进行testing以杀死节点。 crm configure property stonith-enabled=true crm configure property stonith-action=poweroff crm configure rsc_defaults resource-stickiness=100 crm configure property no-quorum-policy=ignore crm configure primitive stonith_postgres stonith:external/ssh \ params hostlist="node1 node2" crm configure clone fencing_postgres stonith_postgres crm_mon -1显示: ============ Last updated: Mon Mar 19 15:21:11 […]

在math上,如何计算基于多个节点的正常运行时间百分比及其各自的正常运行时间百分比?

这个问题更多的是一个math问题,而不是一个服务器的问题,但它是强烈的服务器相关的。 如果我有一台服务器,我可以保证95%的正常运行时间,并且我将这台服务器放在一个2个集群中,那么正常运行时间是多less? 现在,假设我也是这样做的,但是我把它做成3个簇呢? 我们不要把事情看成单一的失败点,而应该把精力集中在这里的math上。 其中一件事情使得这个有点复杂,例如,如果我有2个服务器,那么它们都closures的机会是2 ^ 2,所以这是1/4; 或者3的那2 ^ 3,那么1/8。 考虑到每台服务器都有5%的停机时间,那么总的平均值是那个5%的1/8? 你怎么计算这样的事情?

寻找测量使用CDN的高可用性应用程序的build议

我为一家财富500强公司工作,该公司正在努力准确衡量高可用性应用程序的性能和可用性(例如,5秒页面到页面导航的应用程序可达99.5%)。 我们考虑计划和计划外宕机时间来确定这个可用性数字。 不过,我们最近又join了CDN,这使我们的指标变得复杂一些。 CDN现在可以处理大约75%的stream量,同时将余下的数据发送到我们自己的服务器。 我们试图测量我们所说的“真正的用户体验”(即,我们的testing脚本模拟一个典型的用户点击应用程序)。这些监控脚本位于我们的networking之外,这意味着我们正在使用CDN的约75%时间。 pipe理层决定,我们采取最坏的情况来衡量可用性。 所以,如果我们的原始服务器有问题,但是CDN服务内容还不错,我们仍然会受到影响。 反过来也是如此。 我的想法是,只要“用户体验”成功,我们就不应该不必要地惩罚自己。 毕竟,CDN有提高性能和可用性! 我只是想知道,如果有人知道其他财富500强公司如何计算他们的可用性数字? 例如,我看着一个使用CDN的店面(apple.com),这个店面使用的CDN似乎从来没有出现过(除非将要成为一个重要的产品宣告)。拥有一些硬性的,事实的数据是件好事,因为我不喜欢我们不相信我们需要在这些指标上不必要地伤害自己。 我们正在根据这些数字做出商业决定。 但是,我可以说,鉴于pipe理层可以看到这些指标,问题得到解决和快速解决(阅读:我们快速地浏览了繁文</s>节)。不幸的是,作为开发人员,我不希望pipe理层思考由于某些外部因素(即CDN)正在影响这些数字,所以应用程序已经启动或closures。 思考? (我错误地在StackOverflow上发布了这个问题,对于交叉post提前抱歉)

Gluster究竟做了什么?

过去两天我一直在玩gluster,并在这里和他们的问题系统提问。 我真的不明白一些东西。 我看到人们在说些什么 在服务器之间设置复制砖块(因为您只使用3,复制将会更安全),并且每台服务器都会将所有其他服务器的文件视为“本地” – 即使一台服务器发生故障,文件也会被复制到其他服务器。 要么 Gluster将跨卷(砖块)保持文件同步,并具有“自我修复”function,可处理由于一台服务器脱机而导致的任何不一致情况。 由于我将远程卷从服务器挂载到客户端,gluster如何处理服务器节点(卷挂载的卷)的故障? 从我已经尝试在卷上安装的客户端上的文件夹变得无法访问,我必须使用卸载来解锁它。 之后没有来自服务器的内容。 基本上,我没有看到任何解释: 当服务器节点出现故障时,会发生什么,以及是否有可能真正复制内容,如unison或rsync呢?

在预算上负载平衡Apache?

我试图让我的脑海中围绕负载均衡的概念来确保可用性和冗余性,以便在出现问题时保持用户满意,而不是为了给数百万用户提供高速度的负载平衡。 我们正在做预算,并试图坚持可用的知识丰富的东西,所以在Ubuntu VPS上运行Apache看起来像一个着名的search引擎收购我们( 周六反讽,请注意 )的战略。 至less对我来说,这是一个可用的不同解决scheme的完整丛林。 Apaches自己的mod_proxy&HAproxy是我们通过快速的谷歌searchfind的两个,但没有负载平衡的经验,我不知道什么适合我们的情况,或者我们select一个解决scheme来解决我们的问题可用性问题。 什么是我们最好的select? 我们应该如何提高可用性,同时留在预算内?

什么集群pipe理软件用于Linux?

我find了以下集群pipe理软件工具: 起搏器(clusterlabs.org) – 最初是一个Heartbeat项目,专注于高可用性,将在下一个Debian版本 openqrm(openqrm.com), – web gui – 更广泛的用法,a 一个网站与两个介绍 虚拟整合HA:使用KVM,Pacemaker和DRBD进行虚拟化 虚拟机pipe理和openORM 看来,起搏器使用更广泛。 我有2个硬件服务器的12个不​​同的虚拟机。 我将使用的Linux系统是debian lenny。 安装程序我想要使用:drdb,heartbeart,kvm。 我没有集群pipe理软件的经验。 有没有人有起搏器和/或openqrm的一些经验? 哪个更容易使用? 还有其他候选人吗?

RabbitMQ – 我如何configuration服务器零宕机升级?

阅读了Docs和RabbitMQ in Action之后 ,创build一个RabbitMQ集群似乎很简单,但升级或修补现有的RabbitMQ集群似乎需要重新启动整个集群。 有没有一种方法来组合集群,铲子,联邦和负载平衡,使滚动升级成为可能,而不会丢失队列或消息,或者我错过了一些更明显的东西?

多站点高可用性

我们有一个SaaS应用程序,我们需要高度可用。 我们已经有了一个维护良好的,维护良好的Hyper-V故障转移群集,但是今天我们托pipe这个群集的数据中心有五个小时的停电,导致我们完全脱机。 所以现在我们想知道更好的方法是在两个独立的数据中心使用服务器。 假设我们获得了这两个站点之间的所有后端文件复制和数据复制,我们想知道如何处理前端路由 – 难怪我们如何处理这个问题,我们总是结束负载均衡器单点故障。 所以问题是…我们如何build立两个托pipe站点之间的负载平衡,使负载平衡器不是单点故障? 有没有办法使用两个独立的负载平衡器,每个站点一个? 我们应该考虑循环赛DNS吗?

使用nginx作为主要Web服务器的缺点?

我已经看到数以百万计的网站使用nginx作为代理networking服务器与Apache一起工作。 但是我已经看到很less的服务器只运行nginx作为它们的默认web服务器。 这种configuration的主要缺点是什么? 我可以看到一些: 无法使用每个目录configuration文件,如.htaccess所以每个configuration更改应该对主服务器configuration文件进行,并需要服务器重新加载。 但pecl htscanner可以弥补他们的PHP设置 mod_php对于nginx是不可用的,例如可以通过php-fpm进行补偿。 别人是什么? 为什么人们不放弃Apache并转向nginx或其他任何轻量级解决scheme? 可能是,有一些特殊的原因? 编辑:这个问题主要是关于使用LAMP堆栈。