我想要在Pier1,Q9或某些类似的托pipe设施上托pipe(共同位置)服务。
把我的故障转移硬件放在不同的机柜里是最好的做法,而根据你的经验,主机提供商是否允许这样做?
我担心的是,如果发生什么事情,说在橱柜里发生火灾,或者一个不满的架子租户把焦炭倒入服务器,那么我的HA堆栈都将被破坏。
根据你的经验,如果我把它们放在不同的柜子里,它们可以在同一个子网上,还是反对托pipe政策让我把电缆从一个柜子里拿到另一个柜子里去呢?
还是这种事情永远不会发生,我应该放弃担心?
编辑:这是一个很高的商业价值,无状态的networking应用程序停机时间将是非常有害的。
这取决于您的服务的医pipe局要求。
如果服务对于业务不是那么重要,那么可能没有必要将机柜之间的集群节点分开,特别是如果周边基础设施(如核心networking,负载平衡器等)也被划分的话。
在高业务价值服务中,将故障转移群集中的节点分隔开来分隔开火室是常见的做法,如果企业认为它值钱并愿意付出代价,我build议这样做。
是的,托pipe服务提供商将允许您这样做,除非它是最小的,并且没有多个机柜。
通常情况下,不要在机柜之间运行自己的电缆。 提供商提供机柜之间的互联作为一种服务,你有你的核心networking桥接或提供商也可以提供networking作为服务。
群集中的节点可能使用相同的VLAN,除了群集技术本身之外,它仍然是SPOF ,也可能是常见的存储。 为了防止这些组件中的服务出现故障,您需要构build一个灾难恢复系统,该系统通常位于地理位置足够远的地方,并且该服务是asynchronous镜像的。
单机架电源故障比您列出的大多数其他问题更为常见:单个PDUpopup或电路过载…我曾经发生过这种情况,但没有列出您列出的其他问题。
理想情况下,您的“HA”解决scheme使用两个不同的数据中心。 (例如,AWS区域中的两个区域)
不必要。 这取决于你真实想要保护哪些types的情况。
我有几个HA策略在多个机柜中构build并行应用程序堆栈的环境。 这意味着应用程序/服务的所有层; 交换机,防火墙等存在于两个机柜中,使得我们可能会丢失一个整个机架(或其中的任何组件)而不影响应用可用性。
您没有指定您的应用程序的范围或性质。 更多的细节将有助于那里。 但是如果你正在谈论像一个单一的networking服务器的东西,这是没有必要的。 地理隔离,DNS故障切换和确保单个服务器具有内部冗余(双电源,冗余风扇,RAID)将是一个好的开始。
在设施内的机柜(交叉连接)之间进行布线并不less见。 通常,这是不能获得连续空间的结果。 但是我不担心技术人员将液体饮料洒在您的机架上或发生火灾……虽然可能会发生组件火灾 ……但是我有整个故障转移基础架构堆栈以避免停机。
这取决于。 你的恐惧是合理的,虽然你所描述的问题是罕见的。
如果不是另一个build筑/城市,那么在另一个机架上安装冗余设备肯定会更好。 我不确定我是否会花费额外的费用才能在相邻机架中安装冗余服务器。 但是,如果成本是一样的,它不会受到伤害。
托pipe服务提供商将不允许您在机柜之间运行自己的电缆。 但是,他们会将两个networking端口(每个机柜中的一个端口)放在同一个VLAN中,因此,如果这对您很重要,则可以使用相同的子网。
只有你可以决定什么样的失败是值得的。 一旦你明白了,你会知道是否值得担心。
您提到的火灾或破坏风险或其他类似环境问题的风险不大可能通过将您的技术放置在足够靠近的机架上以使电缆在其间可行的情况下得到充分缓解。 考虑去年在纽约地区的风暴:整个数据中心都没有了。
我build议不要太担心HA,除非在集群成员之间有适当的分离,或者至less如果你清楚这是为了处理正常运行的错误(例如服务器打破),而不是更奇特的东西。
韧性的关键在于它可以像你想要的一样深入或者浅薄(或者有资金)。 技术上相当于你可以单播或多播多达你想要的(或者你有资金)。
如果您的企业对恢复力有要求,那么企业将确定这种恢复能力应该提供多less。 如果你有一个每天需要5分钟的networking,那么韧性有什么好处? 如果您的networking是医院和相关的24x7x365,那么你有一个完全不同的目标。
我曾经在一个环境中工作,那就是前思科公司的员工试图规定要求和我必须做的事情,但是他们通过查看基础设施而不是业务/客户的要求而被误解了。
如果您需要充分的适应力,业务将满足成本。 如果你不,不要打扰..
这真的是别人的决定。