Articles of 高可用性

是否可以查找AWS数据中心之间的距离?

我的公司正在与一个对数据中心之间的距离要求最小的客户进行谈判。 也就是说,它们需要在距离超过3公里的数据中心中进行冗余存储。 在一个AWS地区(法兰克福,如果可能的话)使用两种不同的AZ可以确保这一点吗? 我已经在互联网上search了一段时间,但是我发现的所有内容都是关于AWS区域和AZ架构的通用描述,没有关于形成区域和区域的数据中心之间的地理距离的任何说明。 常见问题解答只说明AZ是 在物理上是分开的,即使是非常罕见的灾难,如火灾,龙卷风或洪水,也只会影响单个可用区 但是我找不到比这更具体的东西。

起搏器故障超时不会重置故障计数

我在Centos7上使用Pacemaker 1.1.13和Corosync 2.3.4。 我有一个主/从资源的问题。 有我的资源meta attrs: 迁移阈值= 1 失败超时= 10S 但是当资源宕机时,只有一次尝试启动它。 文档说,属性failure-timeout = 10s应该每10秒重置一次failcount,但是这并没有发生,所以资源永远不会启动。 你知道这个问题吗? 也许我做错了什么? 我正在发送下面的“电脑状态”: Cluster Name: webcluster Corosync Nodes: 10.121.100.101 10.121.100.102 Pacemaker Nodes: pm-node1 pm-node2 Resources: Master: Services-master Meta Attrs: failure-timeout=10s Group: Services Meta Attrs: migration-threshold=1 Resource: Test (class=ocf provider=scooty type=test) Operations: start interval=0s timeout=20 (Test-start-interval-0s) stop interval=0s timeout=20 (Test-stop-interval-0s) monitor interval=10 […]

ZFS-HA池发生元数据损坏

我按照Github的优秀描述设置了ZFS-HA(见这里 )。 经过广泛的testing后,我使用HBA控制器连接到两个节点的RAIDZ3中使用5×12磁盘将设置转换为生产。 直到昨天晚上,这两个存储池中的一个突然出现“池元数据已损坏”的故障。 在scrub运行期间。 在这一点上,我只能推测是什么导致了这种情况,两个池都是在起搏器中使用SCSI栅栏build立的,而且在投入生产之前,我在testing过的所有故障情况下,磁盘保留工作都完美无缺。 最近发生的唯一重大事件是没有UPS支持的两次完全停电(读取:权力刚刚从一个时刻到下一个)。 但是,也可能是腐败的真正原因是完全不同的。 现在的情况是,我不能再import池了(请在这个问题的最后看到zpool import的输出)。 到目前为止,我所有的拯救游泳池的意图都失败了: # zpool import -f tank cannot import 'tank': one or more devices is currently unavailable # zpool import -F tank cannot import 'tank': one or more devices is currently unavailable 这让我感到困惑,因为它并不真正说唯一的select就是摧毁游泳池(这将是一个致命损坏游泳池的预期反应)。 # zpool clear -F tank cannot open 'tank': no such pool 我也手动删除所有的SCSI保留,例如: # […]

地理冗余工具

我正在编写一个高可用性应用程序的规范。 我需要一个低预算的解决scheme来在两个数据中心之间进行故障切换。 复制数据库和内容我将能够pipe理解决scheme。 什么是从一个地方切换到另一个地方的一些解决scheme?

从多个外部远程站点连接到我的网站

我记得看到一个网站,我可以input我的主页url,然后从世界各地实时获得一系列连接到我的url的服务器列表。 该报告将显示该远程站点连接到我的站点需要多长时间,或者是否超时。 我不记得该网站的名称了。 有没有人知道相同或类似的网站从远程testing连接到我的网站?

什么数据库容易维护和pipe理在一个集群?

我正在寻找一个容易扩展的数据库(DBMS)。 我想有高可用性,所以我需要一个多主集群,其中的数据被复制到两个或更多的物理计算机。 我也希望能够从一个节点开始(不复制),然后按需扩展到更多的节点,而无需重新安装或停机。 我想有一个易于维护和pipe理的DBMS。 应该很容易添加节点,删除节点,进行实时备份和监视资源的使用情况。 它不一定是一个关系数据库系统,所以NoSQL是okey。 我想有一个免费的版本,所以我可以testing它在小规模,并与替代品进行比较。 我有什么替代方法?

服务器在nginxconfiguration中的顺序是否重要?

我有一个自定义的工具,以下面的forms生成nginxconfiguration的一部分,例如: upstream backend { ip_hash; server server1:8080; server server2:8080; server localhost:8080 backup; } 不时有些服务器出现故障,有些出现故障,下一次更新可能会产生以下结果: upstream backend { ip_hash; server server1:8080; server server3:8080; server server2:8080 down; server localhost:8080 backup; } 正如你所看到的,server3已经出现了,server2被标记了下来。 我的问题是:nginx是否关心configuration中呈现的服务器的顺序? 我是否需要对自定义工具的输出进行sorting? 在这个例子中,最初的顺序被改变了,我不知道nginx是否能正确处理它。

vSphere HA – 处理存储hba /链接失败?

我正在考虑在同一个校园的两个地方放一个小集群。 每个位置的vSphere主机都有一个连接到生产局域网的vSwitch,我也将使用一个物理专用iSCSI LAN,两个位置之间都有专用的10Gbps光纤交换机。 如果iSCSI光纤出现故障,则两台主机都将启动并能够ping通另一台主机,但一台主机将无法看到iSCSI共享存储。 我找不到详细介绍如何在上述情况下configurationHA的指南。 提前致谢。

在生产服务器上安装两个版本的MSSQL?

我们只configuration了第二台专用服务器,因此我们可以使用数据库镜像来实现高可用性。 现有的服务器使用MSSQL Express 2005.我们有MSSQL Web 2008,并希望最小化停机时间来build立镜像。 我可以安装MSSQL Web 2008,而生产服务器仍然运行没有任何冲突吗? 任何想法最好的方式来做到这一点? PS这些框运行IIS + MSSQL,我也设置NLB,虽然这是另一个职位

支持HighAvailability和生成树的防火墙

我正在寻找支持高可用性和生成树的防火墙设备。 我有两个ha-cluster节点,我想用防火墙保护它们。 为了避免单点故障,我想有两个防火墙。 而且由于我也需要冗余交换机,防火墙必须支持生成树协议。 我的首选设置: +————+ +———-+ +————–+ lan 1 –| firewall 1 |–| switch 1 |–| ha cluster 1 | +————+ +———-+ +————–+ \/ | /\ | +————+ +———-+ +————–+ lan 2 –| firewall 2 |–| switch 2 |–| ha cluster 2 | +————+ +———-+ +————–+