如何正确地为文件服务器执行灾难恢复?

我们目前正在为Windows文件服务器实施灾难恢复策略。 我们排除了存储复制,因为它是预览function,而故障转移群集是为高可用性而非DRdevise的。 DFSR在复制打开/locking文件方面也存在缺陷,使其不能完成任务。

SAN到SAN复制文件服务器虚拟主机似乎是对我来说最好的方法,虽然我已经被告诫不要这样做,因为复制是一个原始副本,而不是在更高级别合并,可能会导致不一致文件系统或损坏的文件。 但是,这种方法在这种方法中复制的任何服务器都是如此,这是在DR计划中用于其他服务器的方法。 VSS /早期版本也可以用来恢复任何损坏的文件。

做SAN复制的好处是否超过文件可能被破坏的风险? 还是有更好的方法来做一个文件服务器的灾难恢复? 也许有产品执行更高级别的复制/快照,最大限度地减less数据中的逻辑不一致性?

注意:群集正在运行vSphere 5.5

SAN到SAN的复制是尽可能快地将文件服务器恢复在线的最佳select,在宣布灾难发生后尽可能less地损失。 请注意,这种types的DR保护与本地备份无法保护 – 例如,您不能使用复制的SAN卷,例如从上个月取消删除文件。

损坏的文件不是SAN到SAN复制的危险,除非是主站点上的文件服务器损坏它们。 每个提供基于块的存储(LUN)复制的SAN都有一些防止损坏和保证一致性的机制。 这是一个比大多数人都知道的更棘手的问题,因为出于优化的原因,写操作通常不按顺序应用于磁盘,即使没有复制也是如此。 这就是为什么大多数存储器的写caching都有某种电源故障安全网(如电池或UPS)的原因:没有只写入caching的写入,底层磁盘可能会损坏。 通常情况下,这是正常的,但是如果您断电,则需要确保将存储器确认的最后写入内容保存到磁盘,以便在磁盘出现时保持一致。

复制处理方式取决于您如何复制:

  • 同步复制保证了一致性,因为它不会将写入确认返回到本地服务器,直到确认写入已安全地将其写入辅助站点为止。 这样慢下来写得相当厉害,没有供应商支持这种做法,而不是比较低距离的恒星连接。 事实上,所支持的距离通常很低,所以你很容易遭受同样的飓风。 这是罕见的,通常不是唯一的地方。
  • 迄今为止, asynchronous检查点复制是大多数开放系统存储所使用的最常见的algorithm。 该盒子将定期复制一致的检查点,这意味着它将确保在远程系统上find的可恢复副本没有丢失写入。 如果它在检查点中间被中断,则将其丢弃并进入最后一个已知的一致点。 我见过的系统,只要你的广域网支持它,可以让你有15秒的恢复点使用这种方法。
  • asynchronous按顺序传递复制比检查点更难做,但在我看来是asynchronousalgorithm中最好的。 它所做的是按照他们完成的顺序在广域网上发送写入数据。 问题是,与检查点复制不同,如果这种情况落后,则不需要完全重新同步(重新发送所有数据),用于保存未发送写入的存储就不会被刷新。 一般情况下,如果链接跟不上写入,就会回到检查点模式,一旦获得了足够的检查点,就会再次开始按顺序递送。 EMC的恢复点和日立的HUR都做到了这一点,但是我还没有看到任何其他厂商这样设置。

所有这些机制都为您提供“崩溃一致性”。 如果您突然在服务器上closures了电源,磁盘处于相同的状态。 从碰撞一致的副本上运行文件系统和数据库需要一点工作,但总是可行的。 如果您想要更多的东西(在问题中提到“更高级别”),则需要将复制与应用程序集成。 这通常意味着在应用程序中暂停写入操作,等到所有内容都已经卸载到存储器中,然后启动复制的一致性点。 这被称为“应用程序一致性”。 它通常会提供稍高一点的恢复点,但恢复时间要比崩溃一致性略低。

您需要准备好多种级别和种类的灾难,包括全面的恶意攻击(黑客),以及所有硬件(史诗般的天气)的全部损失。 这将需要您将一些数据卸载到运营商networking分发方法(请阅读磁带/硬盘驱动器等外部存储),某种forms的只写一次的解决scheme或联机备份服务(昂贵)。

灾难恢复与简单复制不同。 在决定什么之前,您需要确定这一点:“ 我可以输多less数据? ”千万不要以千兆字节为单位考虑时间 。 我可以失去4小时的数据,我可以失去一天吗? 你select的方法将取决于你对这个问题的答案。 我们都希望有一个零损失的解决scheme,但对于正在缓解的风险,这通常不是一个可行的投资。 您还需要将您的每月/每年的备份副本保留一段时间,因为您也可能发生灾难(用户删除他们需要的废话),而这些灾难在很长一段时间内并不知晓。

SAN到SAN复制是恢复站点灾难的最快方法,但由于固件错误,我在我的IT生活中遭受了SAN腐败,并且它可能变得丑陋

你忘了写你使用的pipe理程序。 但是,如果使用ESX,我build议使用SAN复制vReplicator产品。 默认情况下每15分钟复制一次,远程虚拟机已准备好启动状态。 vReplicator需要一个vCenter许可证和一个物理主机来保存复制的虚拟机(可以比另一个SAN的成本低,但像@IceMage告诉的那样,这取决于您可以释放多less时间)

我build议使用Veeam对文件服务器虚拟机进行低RPO复制。 它具有VSS感知能力,可用于本地复制以及具有多个保留点的WAN和云目标。

设置滚动15分钟的快照,船外时间或样片异地。 成本相当强劲。

如果您有一个远程pipe理程序,则可以configuration一个部分的运行手册,通过适当的networking和IP设置启动一个复制的VM。