Articles of 冗余

你如何设置冗余服务器?

对于那里的系统pipe理员,我想了解如何为小型项目维护冗余服务器。 在我心中,服务器数量不多的是两个,三个主要的基本服务:HTTP,邮件和DNS。 你如何自动化这种双重性? 是rsync的首选工具(再次,小项目)? 除了这些任务的常用工具之外,对书籍和文章的引用将不胜感激。 这种方法越实际,越好。

将单个PSU插入两个不同的电源

我们有一个相当不常见的情况:我们在计算机中心有一台服务器。 它没有足够的空间来放置一个冗余的PSU。 尽pipe如此,我们希望将单个PSU连接到现有的两个电源上,因为它经常发生(就正常运行时间而言)其中一个电源需要维护。 是否有某种魔法黑匣子(几乎就像一个UPS),可以处理两个电源输出一根电源线? 有没有2个电源input的PSU? 任何其他的想法? 我错过了什么? 请注意:解决scheme必须安装在机架上! 谢谢大家!

NTP:如何为NTP服务器build立冗余解决scheme?

在我公司的基础设施中,远程位置有5个数据中心。 在每个远程位置,都有一对服务器用于存放DNS和NTP服务,并在该位置的每台服务器上进行configuration,以便从这两台服务器获得DNS和NTP呼叫。 所有的服务器都是CentOS 6.x机器。 在DNS和NTP方面,在这两个服务器之间创build冗余是一个动机。 DNS部分被覆盖,我只有NTP的问题。 什么是正确的方法,以确保当一个NTP服务器发生故障时,第二/其余的服务器将继续为客户端服务,就像什么都没有发生? 我已经Google了解它,发现一个RedHat解决scheme ,将其中一个服务器设置为主服务器(通过在客户端configuration为“真”),但在“真正”(主服务器)服务器失败…然后它失败了,客户端不会从它那里得到NTP更新,所以它不是一个纯粹的冗余解决scheme。 我想知道有没有人configuration这样的解决scheme的经验? 编辑#1: 为了testingMadHatter的答案,我做了以下工作: 我已经停止在每个NTP客户端上configuration为“首选”的服务器上的NTPd。 我正在等待NTP客户端停止对这个服务器的工作,并开始对付它的合作伙伴NTPd服务器。 我正在客户端上运行ntpq -p来查看更改。 这是ntpq -p的输出: [root@ams2proxy10 ~]# ntpq -p remote refid st t when poll reach delay offset jitter ============================================================================== 10.XX38 .INIT. 16 u – 128 0 0.000 0.000 0.000 *10.XX39 131.211.8.244 2 u 2 64 377 0.123 0.104 0.220 什么是“在ntpq”? 请问我该跑哪个命令? […]

A-Record故障切换?

我有一台FortiGate 100D,带有2x BT业务无限光纤连接,作为WAN1和WAN2。 BT线路每个都带有5个静态公共IP地址,而且我通过CloudFlare托pipe了我的DNS,指向一个WAN连接上的静态IP。 (假设您在mylesgray.com上执行nslookup,您将看到217.45.201.1作为公共IP)。 我们希望我们的Alogging(托pipe网站,VPN,SSH等)的冗余,但显然,2条BT线路有2个不同的公共IP集,所以如果WAN1瘫痪,我们死在水中 – 没有故障转移,因为地址是静态的。 我查了外部的DNS故障转移,但似乎凌乱,对我来说是非常错误(循环赛惹恼了我)。 然后Anycast作为一个选项出现,但是,Anycast似乎需要和整个/ 24块或在一些ISP的casts / 22。 我们正在运行一个企业级的路由器,所以使用BGP等是没有问题的。 任何人都可以阐明如何实现故障转移的DNS A – logging购买一个/ 22的IP块或使用循环的DNS?

当LDAP服务器closures时,Linux控制台不可用

当我们的OpenLDAP服务器断电时,CentOS机器的控制台几乎无法使用。 我们试图用本地帐户login,但是每个命令都需要几分钟才能返回。 即使像ls这样简单的命令也只是坐在那里。 这似乎没有在Ubuntu下相同的configuration问题。 初始login需要一段时间才能成功完成本地帐户,但是一旦完成所有工作。 我正在寻找一种方法来缓解这个问题,并提出了一些想法: 为ldap-pam模块设置超时值(如果存在) 运行一个本地ldap数据库并进行身份validation(这将是主要的奴隶) 创build一个cron作业来启用/禁用连接到ldap服务器的连接 有什么更好的解决scheme来pipe理LDAP的某种冗余/故障转移?

NIC和交换机冗余入门

目前与我的服务器,他们全部或几乎全部有2 nics与一个在使用中。 每个NIC当然连接到一个交换机。 我需要做些什么才能使这个冗余,因为两个网卡都使用并连接到不同的交换机,但将有一个IP自动故障转移。 大多数服务器是运行Windows Server 2003或CentOS / Redhat 5ish的Dell Poweredge服务器。 我从来没有设置过,但我猜这个主题是有点超出了一个服务器故障的问题,所以我只是在寻找关键字(如NIC绑定?),链接,本书build议关于这个主题,需要注意的疑难杂症对于。

用于小型办公室中的HA服务器的DRBD问题

Backround:我们需要在小型办公环境中使用HA服务器,并且正在寻找DRBD来提供它。 我们只有约100GB需要在HA服务器上,服务器负载将会非常低。 如果我们存档较旧的办公室数据,每年的数据可能会增加大约10%-25%,如果我们不这样做,每年可能增加50%-75%。 要点是我们使用消费品级和使用企业级硬件的混合,如果我们不预先规划它,这将是一个问题; 而预先构build的高质量服务器也会失败,所以冗余服务器似乎是要走的路。 计划:我们认为find(2)最好的“我们的降压”服务器并同步它们是件好事。 我们只需要支持SATA / SAS的服务器和空间就可以为价格提供尽可能多的驱动器。 这些服务器好像可以有$ 100- $ 200(+一些零件和额外的驱动器),如果你达成协议。 这在理论上意味着一台服务器可能会失败,如果我们花了几天的时间去解决问题,只要我们没有再次发生巧合的故障,事情就会一直响起,直到我们的IT部门(我)能够实现。 我们将使用Debian作为操作系统。 一些问题 (A)DRBD如何处理驱动器或控制器故障? 这就是显示存储驱动程序之前的DRBD,那么当控制器发生故障并写入脏数据或驱动器发生故障但不立即崩溃时会发生什么情况? 数据是否镜像到其他服务器,在这种情况下是否存在跨服务器数据损坏的风险? (B)DRBD的失败点是什么? 这在理论上只要一台服务器启动并运行就没有问题了。 但是我们知道存在一些问题,那么使用DRBD的失败模式是什么,因为它们大多数在理论上应该是软件? 如果我们要为此有两台服务器,那么使用MYSQL和Apache来运行虚拟机的数据库和Web服务器复制是否合理? (我假设如此) DRBD是否足够可靠? 如果不是,某些任务是不可靠的,或者是更随机的。 search出现了各种各样的问题的人,但这是互联网与看似更坏的信息比好。 如果数据通过LAN进行同步,DRBD是否使用了两倍的带宽? 也就是说,我们应该把NICS加倍,做一些链路聚合和中继? 然后,也许把他们分开的路由器在不同的电路和不同的房间UPS,现在你真的有一些冗余! 就服务器pipe理而言,这对于一个办公室来说太疯狂了吗? 有一个更简单的REALTIME替代(理论上认为DRBD看起来简单)。 我们已经有一台服务器。 所以在我看来,第二台配备DRBD专用驱动器的USED服务器可以很容易地以一些智能购物的价格达到150-250美元左右。 添加第二个路由器,更多的驱动器,更多的网卡(使用),和(2)UPS的,并谈论$ 1,000 +/-。 那相对便宜! 我希望这将主要是在服务器故障期间为我们购买时间。 这些日子,驱动器故障似乎是RAID处理起来更容易的事情。 这是其他硬件故障,如控制器,内存或电源,可能需要停机诊断和解决这个问题。 对于我们来说,冗余服务器意味着使用的硬件变得更加可行,更多的运行时间和更多的灵活性让我能够在我的日程安排允许的情况下解决问题,而不必停止一切来修复服务器。 希望我不会错过这些问题容易search的答案。 我做了一个快速search,没有find我正在寻找的东西。

如何在使用ASA-8.3 NAT后语法时使用ASA IP-SLA来configurationNAT规则?

目前我们正在ASA9上运行冗余IP连接。 我们很乐意configurationip sla以便互联网接入能够承受单一运营商的中断。 我知道ip sla命令,但是当我尝试预先填充所需的NAT规则时,第二个规则的添加会覆盖第一个。 这里是一个例子: object network NYHQ_GUESTWIRELESS_10.110.6.0_24 nat (NYHQ-GUESTWIRELESS,NYHQ-OUTSIDE_FIOS) dynamic interface 当我尝试添加额外的NAT规则时,也许 nat (NYHQ-GUESTWIRELESS,NYHQ-OUTSIDE_COGENT) dynamic interface 新规则覆盖了先前存在的规则,如下所示: object network NYHQ_GUESTWIRELESS_10.110.6.0_24 nat (NYHQ-GUESTWIRELESS,NYHQ-OUTSIDE_COGENT) dynamic interface 有什么方法可以使这两条规则就绪,以便NAT可以与我们的SLA规则合作,以确保无论使用哪个提供商,NAT仍然正常工作?

本地到远程Web服务器故障切换

简短而又甜美,我想你不需要比这更多的细节: 我们在一个内部networking服务器上托pipe我们的网站。 灾难已经发生,而且将会再次发生,因为从networking进出我们的build筑物的通信已经停止。 发生这种情况时,我们希望我们的用户在尝试访问我们的网站时至less看到某种“停机维护”或其他消息(Twitter的失败鲸鱼?),而不是当前的“未find服务器”types的消息他们目前得到。 (静态服务器,所有请求的临时redirect)。 [能够故障切换到一个function齐全的网站将是非常棒的,但不是必需的,可能不是一个选项]。 显然,当我们的本地服务器closures时,必须有某种异地故障转移。 这样的解决scheme如何实施? 其他build议? 编辑:如果我不使用(或遗漏)一些正确的术语,让我知道!

用于站点冗余的VMware vSphere群集devise

使用vSphere群集时,我有一个关于站点减less的最佳devise的问题。 关于我们的情况的一些背景信息,但首先。 我们是一家中型公司,在两个主要办事处设在不同的国家。 我们的networking通过目前使用不足的2层150Mbps租用线路链接。 我们在公司内部有多种服务供内部使用,其中一些服务器在物理服务器上,一些在现有的vSphere群集上。 在我们的部门,我们也运行几个服务(几乎所有的Linux都运行在不同的forms下),比如NTP,Syslog,跳转服务器,监控服务器等等。 我们现在有要求,这些服务器需要在每个位置(他们目前没有)冗余,也是站点redudant(他们在某种程度上,服务器是复制在第二个位置configuration保持同步应用层的各种方法)。 没有SAN可用,至less不是我们现在可以使用的东西。 成本也是一个问题。 虽然我们确实有一些可用的预算,但是我们不能为这两个地点购买SAN。 我看了VSAfunction,似乎这可能是我们的东西,但我不确定如何解决站点的减less的要求。 目前为了进行testing,我在实验室中安装了两台ESXi主机上的带有VSA的vSphere 5。 目前,我正在使用带有VSA许可证的Essentials Plus工具包,这使我可以在最多3个主机上构build一个VSA群集,并使用vCenter许可证来pipe理它们。 每台主机有两个双端口网卡和两个600GB硬盘,运行在Raid1中。 硬件方面,这足以让我们运行所有我们需要的服务作为虚拟机,并在网站内提供冗余。 目前我看到只有两个选项有网站冗余: 在第二个位置创build一个相同的VSA线索,并在应用层(数据库同步,rsync等)保持各种服务同步。 只需将其中一台主机从现有集群移动到第二个位置,基本上VSA集群跨站点之间的150Mbps链接。 我非常喜欢第二种select,但是我不能确定它的工作效果如何,只要它能工作。 从技术上讲,我们可以跨越租用线路上所需的VLAN,并在第二个地点提供这些VLAN。 好处是我们不必担心同步数据库等等。 但是我感觉带宽不够,我无法知道VSA集群在主机之间会产生多lessstream量。 我意识到这很可能取决于各个虚拟机的使用情况,但是我仍然不知道VSA如何在ESXi主机之间复制数据。 这些是我唯一的select,还是可以通过其他方式实现我的目标? 在第二个地点,从主要地点每晚同步一次虚拟机,有没有办法让某种“冷静待机”的群集? 这个想法是,如果第一个网站变得不可用,我们将能够把所有这些虚拟机在网上。 我们可以确定1天的数据。 任何答案表示赞赏。 最好的问候,斯蒂芬