Articles of 冗余

为以太网获得“透明”冗余的最佳方法是什么?

我很抱歉,如果这是一个明显的问题,我是一个新手,只要冗余networking去,我不知道什么关键字谷歌。 我的应用场景是这样的: 该系统由less量基于Linux的服务器组成(从1到20) 每台服务器上都有两个物理以太网接口 系统运行在一个孤立的局域网上 – 它没有以任何方式连接到互联网 运行在每个服务器上的(自定义/内部)应用程序软件通过持久的TCP连接和/或UDP多播与其他服务器上的对等体进行通信。 所有通信都通过IPv6进行 为了获得networking冗余,显而易见的事情是要有两个高速以太网交换机,并将每个Linux服务器连接到两个交换机。 这样,如果其中一个交换机出现故障,或者有人不小心通过以太网电缆切断,则可以通过其他电缆/交换机继续通信,并且系统将保持全部function。 我的问题是,有没有办法使应用软件的冗余度达到100%? (透明的,我的意思是说,应用软件不应该知道或关心有多个以太网端口;理想情况下,它只会看到一个eth0而不是一个eth1 …如果数据停止stream过其中一个两个物理以太网端口,不pipe是什么原因,应用软件都不应该检测到故障或者做任何特殊的事情来继续工作)。 额外的带宽对于我的目的并不重要(千兆以太网的一条“通道”足够快),但是简单性和可靠性却是如此。

关于网站正常运行时间的问题

我在一个网站上工作,我们需要有很多的正常运行时间。 特别是在网站事件发生的短时间内(15天)。 该页面非常简单,几乎可以完全从htmlcaching中提供。 虽然有一个基于PHP的部分,这不是任务的关键,如果发生故障,我们可以在20分钟内caching,直到最终的问题被解决。 超过20分钟将不会真正工作,因为该网站举办一个现场比分板和其他事情。 我们在Amazon中使用多个具有弹性负载平衡的EC2以及Rackspace云(云站点和云服务器)进行了成功的部署。 对于这个特定的网站,我们希望同时在这两个提供商中运行该应用程序,但只从其中一个服务器提供这些网页。 如果主要提供者失败只是移动到另一个继续前进。 我知道如何使一切工作在一个提供者。 我不清楚如何实现从一个供应商到另一个供应商的实际转换。 例如,如果我将CNAME myapp.com添加到Rackspace中的某个域中,并且失败,那么当我将CNAME更改为指向Amazon时,很多用户将DNScaching到Rackspace,整个过程将毫无意义。这是我有很多问题之一 任何帮助非常感谢…提示,build议,陷阱,任何东西都是值得欢迎的…

冗余NFS安装?

是否有可能创build一个容错,冗余的NFS服务器(如主/从)? 我的几个Web服务器从单个NFS服务器(定期备份)装载他们的WEBroot目录。 只是试图删除任何SPOFs。

你如何确保两个数据networking链路没有SPOF?

如何确保两个数据networking链路没有SPOF(单点故障)? 我们正在研究数据中心networking连接,并且需要确保不会有SPOF。 我们将有两个networking链接连接到数据中心。 问题是:你如何确保两个链接没有SPOF? 你会build议从相同的networking供应商订购这两个链接吗? 或不同的提供者? 如果不同的提供者,你通常会得到什么样的信息?

我可以通过JBOD存储子系统获得冗余吗?

我有一个无极技术J610S。 这是一个JBOD子系统。 是否有可能购买SAS硬件RAID控制器并为这些驱动器提供某种types的冗余? 我不确定我是否会使用Linux或Windows,所以对枚举的答案将不胜感激。 我想到的一个解决scheme是:如果我的J610可以导出每个驱动器为目标,我的服务器将只看到16个驱动器。 如果需要,RAID控制器可以执行RAID5 / RAID6。

两个镜像的数据库服务器,或两倍的function

我正在为我的一个应用程序设置一个单独的数据库服务器,该应用程序目前运行在3台服务器上; 1个前端服务器和2个应用程序/数据库服务器。 但出于性能方面的考虑,我正在将数据库移到自己的机器上。 所以归结到这一点,我最好把两台服务器设置为对方的副本。 或者只是一台服务器,但它使function强大一倍? 我到目前为止想过的东西; 使用一台服务器: 易于pipe理 更多的CPU /内存/磁盘可用的数据库,因为操作系统将只占用一个大量的资源 更多的存储空间(如果数据库被复制,我需要两倍的磁盘存储量来存储相同的数据) 便宜(租用的服务器只有一点点,但我更想购买的服务器) 有两台服务器: 更好的冗余(内核恐慌/磁盘故障/操作系统故障/networking故障和数据库作为一个整体仍然可以工作,但可能会放慢一点) 每个服务器的磁盘/networkingIO更less(这会使速度更快吗?) 一些特定于我的情况的技术细节; 服务器将运行在名为StormOnDemand的云服务上,所以我们不会有太多的硬件可靠性问题。 我们也可以根据需要垂直缩放。 我们使用4种不同的数据库系统 Postgresql,MongoDB,Redis和Memcached * 上次我查了一下,我们每天在Postgres上的平均交易量只有2毫米左右,在Mongo上大约是2.5mill,不知道Redis和Memcached,但是我们用它们来caching,所以我想它们差不多。 服务器都通过1GB / s的本地networking连接。 关于中等大小的数据库(Postgresql:32GB,MongoDB:16GB,Redis和Memcached都使用内存进行存储,但我认为他们目前运行Redis:12GB和4GB) 我想要得到的服务器将是单个服务器的8CPU和30GB RAM,或者两个服务器的4CPU和8GB RAM 对于redundency,这是一个networking应用程序,绝大多数的访问者都在这样做,虽然我们不想停机,但是我们会很高兴每个月花费几个小时来节约从单个服务器。 在运行超氧化物歧化酶(SOD)的6个月中,我们从来没有任何停机时间,但这并不是说将来不会发生。 如果我已经排除了任何有用的细节,我很乐意提供这些细节,但是我尽可能地join了这些细节。 * Memcached将继续在应用程序服务器上运行,因此我们将其用作“本地caching”,因此不会在服务器之间复制/分片,使用Redis作为分布式caching

两个托pipe服务提供商同时运行…可能/不可能? 好的做法/不必要的?

为了他们的名誉,我不会提到这些名字。 但我只会使用: 以前曾为我工作的业务 – ABC Web Dev 他们使用的托pipe公司 – XYZ托pipe 我最近发现,XYZ Hosting发生了一些事件,最终导致他们的客户数据丢失,包括ABC Web Dev。 ABC Web Dev能够从本地开发计算机中将其部署到另一个托pipe服务提供商后,恢复其部分客户的网站。 他们因为这样做而失去了很多客户,他们的声誉被毁了。 我开始自己的networking开发公司,我不想遇到这个问题。 我打算使用Rackspace,但尽pipe他们是一个伟大的公司,但根据维基百科,他们过去仍然停机 。 我认为尝试同时运行两个提供商可能是一个好主意,以确保如果发生任何事情,网站仍然会因为另一个而生存。 我知道网站必须始终从一台服务器上下载,但如果有方法可以将请求redirect到第二台服务器,如果第一台服务器出现故障,则可以解决问题。 请注意,我们将在本地设置一个临时环境设置,如果提供商确实有任何问题,可以快速恢复,但是如果可能的话,我想避免任何停机时间。 所以我的问题是: 有没有人试过同时运行两个提供商? 这会被认为是好的做法还是我太过分了? 在一台服务器作为备份的情况下,是否真的有办法同时运行两台服务器?

多余的nfs份额

我们正在将文件存储在networking共享中,我们的应用程序使用nfs来确定这个驱动器。 现在我们有要求这个驱动器是多余的。 我们可以添加第二台服务器,然后与该服务器同步direcory。 什么是同步的最佳方法? 如果一台服务器出现故障,我们怎么做故障转移? 有没有办法在NFS指定一个备份驱动器和NFS是自动从备份驱动器获取数据? 如果这是不可能与nfs,是否有另一个文件系统支持类似的东西?

一个SCSI目标中的冗余

从我之前提到的关于复活一台古老的Intergraph 6800机器( 在Unix(CLIX)系统上额外login的许可证文件 )的问题上,原来的问题是一个失败的硬盘,所以这一定不会再发生。 所有关键的数据都在单独的/ usr分区上,所以我想知道如何使文件系统更健壮。 在一个现代的系统上这将是微不足道的,但在这个古老的Unix这是一个挑战。 一个选项是将/ usr安装在一个单独的,具有RAIDx的现代化机器上,但是NFS客户端软件是一个单独的授权选项,我不知道现在是否有人可以为我们提供许可证。 CLIX软件不包含任何types的元设备软件,如Sun的md子系统,可以将多个原始设备视为一个。 所以我想知道:有没有像SCSI-2盒子似乎是一个单一的目标,但实际上包含冗余磁盘? 另一个select可能是在机器上编译一个旧版本的Samba客户端软件,但是它开始变得有些棘手。 回退选项是通过FTP不时closures关键数据,但这有点低科技,我怀疑这样做的程序将被忽略。

通过HDD的SSD冗余

有没有一种方法可以保证使用硬盘的SSD冗余? Raid 1是保证硬盘冗余的最佳select,但SSD太昂贵,无法通过RAID保证冗余。 如果我要将SSD与HDD连接起来,我可以使用硬盘作为故障转移设备来保证冗余,并且懒散地镜像硬盘上的数据吗? (例如:每5分钟应该同步数据,而不是像Raid 1一样实时)。