Articles of 冗余

在不使用RAID的多硬盘LVM中遇到硬盘故障时,是否会失去一切?

我在讨论如何将LVM用于媒体/文件服务器,因为我想将多个物理硬盘组合成一个卷。 我不想在我的LVM中使用任何RAID,所以我的问题是: 如果我的卷中的多个硬盘中的一个硬盘掉了,我会丢失所有数据,还是会丢失存储在单个磁盘上的数据? 而且,如果我只是丢失了单个磁盘上的数据,是否会像replace该磁盘一样简单,并从备份中恢复它的恢复? 感谢大家。

用自己的UPS保护机架供电是否有任何价值?

我已经做了一些看,并没有find一个令人满意的答案这个问题。 什么时候需要或build议使用一个独立的UPS(在它自己的主电源分支电路上)为每个机架供电? 详细说明; 当使用具有冗余电源的服务器时,通常build议每个“1”电源连接到分支电路“A”,每个“2”电源由分支电路“B”供电,但是您是否需要UPS 'A'和'B'的饲料,还是只有一个? 背景:我的任务是规划基础设施升级到内部使用的服务器。 我们是一家制造公司,我们的大部分设备和定制软件都依靠在我们的办公室本地拥有可靠的在线服务器。 我们现在有两个服务器机房,每个机柜都位于一座大型build筑的两端(为了防止火灾或事故等)。 他们每个人都有一个从电路“A”馈电的UPS,而我们拥有的,有多个PSU的设备都连接到这个UPS。 所以,如果UPS要死了,那么服务器就是这样。 我个人的理论是,每个服务器的PSU1连接到一个UPS,并且每个服务器的PSU2连接到一个直接从主电源供电的PDU,将提供良好的可靠性和成本组合。 但是我的主pipe认为我们应该运行两台UPS机组,每台机组一台。 如果这个问题太模糊,请让我知道,我会尝试修改它。

什么时候RAID值得麻烦?

在我们的店里,我们忠实地在我们所有的工作站中使用RAID,可能只是因为这似乎是它应该完成的方式。 我正在谈论使用板载RAID芯片进行科学模拟的工作站。 但是我听说了很多RAID恐怖故事。 Stackoverflow本身有一个由RAID控制器间接造成的中断 。 RAID可以保护您免受非常狭窄的故障 – 物理磁盘故障 – 但同时也会引入额外的故障点。 RAID控制器可能会出现问题,而且经常出现这种情况。 至less在我们的商店里,似乎RAID控制器至less和磁盘一样经常出现故障。 您也可以轻松搞定交换故障驱动器的过程。 什么时候RAID值得麻烦? 通过为备份解决scheme增加更多冗余,您难道不会获得更好的投资回报吗? 哪种types的RAID在这方面更好或更差? 编辑:我已经改变了原来的标题“是RAID值得麻烦吗?”,所以听起来不那么消极

如何制作冗余负载均衡器?

我了解负载平衡器的目的是平衡服务器之间的负载并跟踪实例的健康状况等。但是,如果负载平衡器本身失败呢? 你如何设置冗余负载平衡器? (负载平衡负载平衡器?) 我可以看到DNS健康检查如何有用,但显然存在主要的延迟问题,不是吗? 假设您没有使用任何第三方服务,如AWS ELB或类似的东西。 如果你只是使用Nginx,该怎么办?

如何防止预算损失的服务器

我是一个小公司,没有太多的预算,为慈善机构和非营利性客户提供网站和数据库。 我有一些Debian Linux VPS服务器,并确保每天备份到不同的VPS,而不是服务托pipe的VPS。 最近我的一个托pipe公司告诉我,两个驱动器同时失败,数据永远丢失。 东西发生了,他们说对不起,他们还能做什么? 但是,这让我怀疑,在出现硬件或其他主机相关故障的情况下,基本上能够获得VPS的成本效益。 目前我将不得不 转动一个新的VPS 将最后一天的备份(包括数据库,Web根目录和网站特定的configuration)复制到VPS上,并像最后一个那样configuration它。 更新DNS并等待它传播。 这可能需要一天左右的时间才能实现,尽pipe我将TTL设置得相当低(大约一个小时左右),但DNS传播还是个未知数。 一些主机提供的快照可用于复制设置到一个新的VPS,但仍然有IP,这对主机公司彻底取消/暂停帐户的情况没有帮助(我一直在阅读这个来自某些托pipe服务提供商的行为,这让我感到害怕!我没有做任何垃圾邮件/狡猾的事情,并且密切关注安全性,但是我意识到他们确实有能力做到这一点,而且我很冒险)。 这是否与select信誉良好的主机相结合,我可以做的最好的事情,而不去一个令人难以置信的昂贵的解决scheme?

刀片服务器机箱故障的可能性

在我的组织中,我们正考虑购买刀片服务器 – 而不是机架式服务器。 当然,技术厂商也让它们听起来很不错。 我经常在不同的论坛上读到的一个问题是,服务器机箱有理论上的可能性下降 – 这将导致所有的刀片服务器停机。 这是由于共享基础设施。 我对这个可能性的反应将是有冗余,并由两个底盘,而不是一个(当然非常昂贵)。 有些人(包括HP供应商)试图说服我们,由于冗余(冗余电源等),机箱非常不可能发生故障。 我的另一个担忧是,如果出现问题,可能需要备件 – 这在我们的位置(埃塞俄比亚)是很困难的。 所以我会问有经验的pipe理员,他们pipe理着刀片服务器:你有什么经验? 他们是否整体下降 – 什么是合理的共享基础设施,可能会失败? 这个问题可以扩展到共享存储。 我再说一遍,我们需要两个存储单元,而不是只有一个存储单元,供应商们又说,这个东西如此稳定,以至于不会出现任何故障。 那么 – 我简直不敢相信,这样一个关键的基础设施可以是非常可靠的,没有冗余 – 但也许你可以告诉我,你是否有成功的基于刀片的项目,其核心部分没有冗余(机箱,存储… ) 目前,我们看看惠普,因为IBM看起来太贵了。

Round-Robin DNS是否足够“满足静态内容的负载平衡”?

我们有一组共享的静态内容,我们在http://sstatic.net的网站上提供。 不幸的是,这个内容目前不是负载平衡 – 它是从一台服务器提供的。 如果该服务器出现问题,那么所有依赖该服务器的网站都将被closures,因为共享资源是共享的JavaScript库和图像。 我们正在寻找在这台服务器上负载平衡静态内容的方法,以避免单一的服务器依赖。 我意识到,循环赛DNS最好是低端(有些甚至可能会说贫民窟 )的解决scheme,但我不禁想知道 – 循环赛DNS是一个“足够好”的解决scheme,用于静态内容的基本负载平衡? 在[dns] [load-balancing]标签中有一些讨论,我已经阅读了关于这个主题的一些很棒的post。 我知道通过多个循环AloggingDNS负载平衡的常见缺点: 通常没有使用DNSlogging进行心跳检测或故障检测,因此如果轮换中的给定服务器出现故障,则必须手动从DNS条目中删除其Alogging 生存时间(TTL)必须设置得相当低,因为DNS的条目在互联网上积极caching 客户端计算机负责看到有多个Alogging并select正确的logging 但是,作为首发者,轮到DNS是足够好的,比没有好,“我们研究和实现更好的替代scheme”forms的静态内容的负载平衡? 或者在任何情况下,DNS循环都毫无价值?