Articles of 高可用性

如何使AD适用于将其用作LDAP服务的应用程序

我们的情况 我们目前有许多Web应用程序使用LDAP进行身份validation。 为此,我们使用LDAPS端口( 636 )将Web应用程序指向我们的AD域控制器之一。 当我们必须更新域控制器时,这已经引起了我们的问题,因为更多的Web应用程序可能依赖于任何DC。 我们想要什么 我们希望将我们的Web应用程序指向集群“虚拟”IP。 该群集将至less包含两台服务器(以便每个群集服务器可以被轮换出来并更新)。 然后,集群服务器将代理到DC的LDAPS连接,并能够找出哪一个可用。 问题 对于任何具有为AD的LDAP接口创buildHA群集经验的人员: 你用什么软件为集群? 任何警告? 或者也许完全不同的架构来完成类似的东西? 更新 也许我的问题最初不够清楚。 我为此道歉。 这些Web应用程序不是由我们开发的,也不是AD识别的。 他们只要求一个LDAP服务器的主机名/ IP地址。 不幸的是,我们必须处理这个限制。 我理解SRV records是如何工作的,但是,这些不是我们的应用程序,在这种情况下并不能帮助我们。 我们强迫开发人员修改他们的应用程序使其能够识别AD也是不现实的。 唯一的select是在基础设施内解决与软件相对的问题。 我的问题是针对任何具体做到的人。

有关xenserver HA的一些问题

开始感谢您的未来帮助:) 我想知道是否有可能将我的HA包装在我的油漆上(请原谅我的质量)。 我还想知道在HA和服务器出现故障的情况下,它如何与ipv4故障切换块配合使用? 我的最后一个问题,在我的iSCSI上,如果硬盘驱动器崩溃的话,数据丢失,如果我理解正确的话? 所以我想知道你是否需要进行RAID或备份? 而不会失去太多的空间^^ 提前谢谢,我为我的英语道歉。 亲切

Googlenetworking架构

我知道这个问题可能会被视为“不是真正的问题”,“主观的”甚至是“论证的”。 如果这是一个错误,我很抱歉。 我在networking上并不擅长,但是我正努力变得更好,学习更多。 (你可能知道这句话:“智力的第一步是承认你是愚蠢的”:P)。 networking方面,在我的浏览器中inputwww.google.com并按回车键后会发生什么? 以下是我所知道的: 浏览器应用程序发出DNS请求来查找www.google.com的IP。 它可能会发现209.85.148.105(这就是我现在刚刚解决的)。 然后它通过TCP / IP连接到端口80(HTTP的默认端口)上的主机,并发送一个HTTP请求,如GET / 接收HTML数据并显示它(以及加载额外的资源,如.css,图像文件等) 我想知道的是它如何一步一步连接到Google服务器 。 请求从我的电脑和我的ISP终止后,终于在某个时候点击谷歌硬件。 有负载平衡器吗? 他们有多less? 是否有多个级别的负载均衡器? 即:负载均衡器的负载均衡器负载均衡器… 最终的Web服务器有多强大? 它可能是一个糟糕的500兆赫CPU机器与512MB RAM和10 GB硬盘? 或者,也许是一个8核,16GB的RAID-0 SSD野兽? 他们在networking级使用什么样的冗余? 如果负载平衡器失败会发生什么? 如何使www.google.com不可用? (不,我不想破坏或者……)

高可用性的定义是什么?

就我的理解而言,服务或系统的可用性被定义为: (Time resource was available – Time resource was unavailable) / Total Time 我的问题是: 是否将一个系统/服务描述为一个标准的行业公认的术语“高度可用”? 这导致我的下一个问题: 如果软件供应商声称销售高可用性解决scheme,那么对于解决scheme是否符合描述,是否可以合理预期最低的可用性级别?

冗余服务器应该有完全相同的configuration,还是略有不同?

如果您在两台服务器上提供服务以确保高可用性,那么最好是以完全相同的方式configuration它们,而不是应该引入轻微的差异来防止“畸形configuration”错误? 我们在Linux(Ubuntu LTS),Nginx,Apache和Python WSGI堆栈上托pipe一个基于Django的网站,在负载均衡器后面的三台服务器上复制。 目前他们被托pipe在亚马逊云,但我们可能会转移到我们自己的数据中心在未来。 我们最近在三台服务器上都遇到了一个问题,这个问题只能通过升级内核来解决,这使得我们认为这个特定版本的内核与亚马逊可能已经开始使用的物理硬件是不兼容的。 这让我想:将所有机器保持在完全相同的configuration(更容易pipe理?),还是应该保持稍微不同,以便两个组件之间的不兼容性只会在一台机器上performance出来,而不是全部他们,保持你的网站在空气中?

网站高可用性没有负载平衡器?

我正在考虑更改通过https API提供服务的“高可用性”网站的选项。 目前的设置是: 两个独立的虚拟机,来自不同的云提供商(AWS和RackSpace) 一个DNS负载平衡器:这也是HA进来的地方,服务监视两个虚拟机,如果看起来不可用,它将所有的DNS查询指向另一个 如果不需要负载均衡,那么我们可以通过在两台机器上简单地共同定位DNS服务器来实现负载均衡,而每台DNS服务器只有在查询DNS时才使用自己的地址进行响应。 在这种情况下,如果一个虚拟机closures,将删除指向该服务的服务和DNS服务器,因此没有客户端将被引导到服务器closures,是正确的吗? 编辑清晰度: 我们对我们目前拥有的不完善的“HA”感到满意,这个问题具体是关于我所想的改变是否会让事情变得更糟。

使用ZFS头节点作为数据库服务器?

我正在使用基于Nexenta推荐架构的双头ZFS支持的NAS来实现高可用性群集共享存储,如下所示: 1 JBOD中的磁盘将存储单个4 TB Postgres数据库的数据库文件,以及其他JBOD存储20 TB大型原始二进制平面文件(用于大型恒星物体碰撞模拟的聚类结果)中的磁盘。 换句话说,支持Postgres文件的JBOD将主要处理随机工作负载,而支持仿真结果的JBOD将主要处理串行工作负载。 两个头节点都有256 GB的内存和16个内核。 该集群有大约200个核心,每个维护一个Postgres会话,所以我预计大约200个并发会话。 我想知道在我的设置中是否明智地让ZFS头节点同时作为我的群集的一对Postgres数据库服务器? 我能看到的唯一缺点是: 缩小基础设施的灵活性较差。 略低的冗余水平。 Postgres的内存和CPU资源有限。 然而,我看到的好处是,ZFS对于自动故障转移是非常愚蠢的,无需花费大量的工作就可以让每个Postgres数据库服务器找出头节点是否失败,因为它会与头部一起失败节点。

使用LVS(Linux虚拟服务器)做DNS HA

我一直在尝试使用CentOS 6.x创build一个LVS DNS HA: 食人鱼GUI来configurationDNS Pulse是CentOS LB的HA心脏 由于DNS使用TCP和UDP 53,IPTables在数据包上configuration标记 几天后,我发现我不知道如何使它工作 – 我希望有人有lvs.cf文件可用,以及所有必要的iptables规则。 或者,如果有人已经使用了一些其他的OpenSource&Free软件,允许做DNS LB(不是圆的DNS DNSlogging – 这不是这个练习的目的)。 如果有人成功地在LVS下使用了两台或更多的真实服务器在域名服务器上工作,我将不胜感激,如果可以发布configuration: lvs.cf iptables规则放置 我主要是寻找直接服务器返回或NAT – 任何解决scheme将为我工作。 先谢谢你。 吉姆。

如何抑制从故障转移数据中心启动的心跳资源?

每个数据中心都有一对CentOS Linux服务器。 他们在每个数据中心都有故障切换,由心跳和DRBDpipe理(我知道这些都是过时的工具,但是它们是稳定的,所以不需要改变它们)。 它们也具有数据中心交换的能力,使东部数据中心处于活动状态,而西部变为被动状态。 但这是一个手动工程过程,没关系。 西数据中心目前是主动数据中心,东数据中心是被动的。 serverA.west <-> serverB.west <———–> serverA.east <-> serverB.east ACTIVE DATA CENTER PASSIVE DATA CENTER 服务器可以运行mysqld和一个Java应用程序。 此服务器上的Java应用程序只应在活动数据中心(即serverA.west)的主要主机上运行。 如果Java应用程序的另一个实例在辅助主机(serverB.west)上启动,或者在被动数据中心的任一主机上启动,则存在裂脑问题的风险。 今天serverA.east重新启动,导致心跳翻转到serverB.east。 心跳然后忠实地启动了serverB.east上的Java应用程序,我们不希望发生这种情况。 Heartbeat也在serverB.east上启动了mysqld,这是正确的,因为MySQL复制应该继续下去,连续复制来自西部数据中心的变化,以便东部DC在需要时可以接pipe。 /etc/ha.d/haresources将mysqld和Java应用程序的/etc/init.d脚本命名为要启动的资源。 我们希望允许心跳来pipe理被动数据中心中的A / B对。 它应该在故障转移时启动mysqld,但不启动Java应用程序。 但是,如果东数据中心是活动的,那么在心跳自动故障转移期间,心跳应该启动Java应用程序。 什么是实施这个好方法? 我所希望的是,当我们将活动数据中心从西方切换到东方时,需要采取一个步骤进行configuration。 理想情况下,它应该是防错的,也就是说,应该确保只有一个数据中心被configuration为活动数据中心。

SQL Server集群选项

任何人都可以提供SQL Server集群可用选项的高级概述,其优点和缺点? 使用Microsoft群集服务或SQL Server本地群集更好吗? 这个select是否适用于最新的SQL Server版本?