当SAN运行超过其支持期限时,我会遇到什么麻烦?

我们正在更换Clariion CX320 SAN,因为它已经过时了(7.5岁)。 否则它是非常可靠的。 是的,我们已经更换了很多磁盘,电池模块,甚至可能是其中一个控制器,但是故障率并不是很高 – 可能每九个月大概一次。

新的SAN是具有类似性能特征(IOPS,networking等)的均衡逻辑。 即使这个技术真的没有什么新的变化(除非我们想要10gignetworking或者SSD磁盘,我想这样做却不能certificate花了两倍的代价)。 我认为大的变化可能就是价格点,当时我们为CX3支付了40k,而类似设置的价格也是这个价格的一半。

我想把CX3-20保留在生产中,但是我不得不提出一些情况,这个东西应该能够在没有高成本的情况下再活4-5年。 我们不得不从EMC以外的地方采购部件,因为这是非常耗时的(实际上这并不是坏事,因为第三方部件非常便宜,唯一的缺点是需要1-2天的时间才能获得部件,而不是同一天在几小时内)。

所以问题是:有没有人真的把这些东西运行了12年,并且像以前一样坚如磐石? 失败率应该是随着时间的推移,但我没有看到它发生。 我们有3个7岁以上的SAN。 我们在2-5岁时遇到了问题,但过去的2.5年并不糟糕。 也许在3 7+年以前的SAN中,我们已经replace了总共4个磁盘。

我知道,在与经销商/供应商交谈时,有很多人运行“很多这样的报废”SAN,但我永远不能和他们背后的人交谈。 他们是否经常头疼,但他们正在运行这个东西的橱柜,他们不能certificate升级的成本? 或者他们可能是托pipe公司,他们无法承受迁移虚拟机的停机时间……或者这些东西真的是稳定的,如果你维护它们,它们将永远持续下去,而“报废”只是EMC的推动方式我们买新的装备?

    这是一个计划和设定期望( 对用户,业务等 )的练习。

    我将以服务器为例。 当我出售/购买一个系统时,我计划它的主要使用寿命为3 – 5年。 对于现代设备来说,这是一个相当不错的衡量标准,因为在这段时间之后,通常会有大幅度的技术上的跳跃,而且是很好的certificate。 这也是系统出现故障的时候。

    超过这个年龄的系统仍然可以使用,但是缺less部件和支持会将较旧的服务器归为非关键function,或者在可以容忍故障的群集中使用。

    自EMC广泛使用以来,存储也发生了变化。 我想说,SAN存储已经变得更加商品化,具有更加智能的caching和性能特征。 你可能在桌上留下了很多的performance

    至于保持使用旧的单位,你可以,但为什么不依靠你有新的设备? 通过保持较旧的装备,你期望获得什么?

    在“旧”套件中您将遇到问题:

    • 代码更新:供应商很less会承诺在旧套件上发布更新。
    • 更换零件:备件将变得越来越难以通过 – 有时您可以使用较新的零件,但不总是,因为速度/通信模式/协议等得到更新。 较新的SFP停止支持较低的传输速率,这样的事情。
    • 移动部件的故障率:旋转磁盘磨损,所以您将开始看到磁盘故障率的增加。
    • 基础设施兼容性:供应商喜欢随着时间的推移改变协议 例如,Windows域控制器会弃用遗留encryption协议。

    您还支付升级的机会成本:

    • 新玩具通常更大,更好,更快。 存储并不能满足处理器的需求,但是利用闪存驱动器,更大容量的内存caching等function还是非常不错的。
    • 雇用有经验的人将变得困难。
    • 当你最终做出转换的时候,平稳地增加了迁移开销,因为迁移到一个技术世代的跳跃path不太好。
    • 一些供应商提供折价交易,这与汽车零售商的原因大体相同。

    我不会说这是一个坏主意,但是您需要考虑为什么您首先购买了存储arrays。 他们通常是相当昂贵的购买能力的方式 – 你正在做的是利用性能超过订阅 – 以相同的“平均”来获得更好的“突发”。 在磁盘层和caching层。

    由于可靠性的提高,它们也更加昂贵 – 具有更好MTBF的“企业”组件。

    这两件事情随着时间的推移而减less。 前者是因为球门柱移动,后者是因为磨损和可用性。

    所以,与其他任何事情相比,这更像一个可接受的风险问题。 对于我的生产套件,其数据对于我的组织来说比FAR更重要,而不是更换和供应商支持合同的成本。

    对于我的testing/开发工具包,我并不在乎。

    因此,我build议你将这个提供一点点, 这不是省钱的延期支出。 你仍然需要更换它。 随着年龄的增长,您将需要额外的费用。 你将会使你的replace和迁移变得更困难。 你也承担了一个不可修复的错误的商业风险。 这将需要供应商的支持,谁将指向和笑,或打一个荒谬的法案打你。 或者也许两个。

    但是,您可能会发现在此期间存入的资金抵消了成本,而通过延迟​​购买,您可以获得更大,更快的收入。

    浴盆曲线适用于此: http : //en.wikipedia.org/wiki/Bathtub_curve

    它非常适用于存储arrays。 你可以很好地比较一辆汽车 – 随着汽车变得越来越老,保持在道路上的成本稳步增加,破产的可能性也越来越大,价值交易也越来越less。 如果每隔几个月分解一次,需要修复它是可以接受的,那么你可能会运行一辆旧车。 但是,你不会用救护车做这件事,因为虽然赔率是相同的,但是失败和宕机的后果也是如此。

    我们和CX300的情况大致相同,都是大致相同的年龄(8年以上)。 我完全同意这个观点,那个东西是坚如磐石的(我们只是交换了一些磁盘,在那些年里,一个控制器电池出现故障),但是我不会把它拉长到很远。 由于我们的存储已经停止服务,我们决定将其迁移到一个用例,其中可靠性不是主要目标(在我们的情况下是备份假脱机)。 当然,有可能你们的CX320没有太多的麻烦,而且还有更多的年限,但是请记住,在IT方面总共8年,尤其是“移动部件”,相当长的一段时间。

    从经济angular度来看,在一定的时间内(或者已经是!),在维护CX320不会购买新东西(磁盘变得更大,FC磁盘在未来不易获得的情况下)

    我的build议是保持它在一个地方运行,在那里可靠性并不重要,或者你可以快速和无压力地replace它(例如,保持新的存储已经build立为“冷备用”)。

    老实说,除非CX-3上的数据的“严重性”不能及时/不及时地移动,否则就会咬紧牙关,转移到新的东西上。

    升级的其他好处:1.更小的机架空间,更大的存储空间,更大的磁盘空间和更小的外形尺寸。 2.由于固态硬盘和更现代系统中的大量caching,混合工作负载的性能要好得多。 有时候,事情的发展不仅仅是简单的零件交换。 发生这种情况时,您需要官方供应商支持。