可以通过WAN链接进行实时或同步复制吗?

我工作的公司正在寻求通过跨越2000多英里的广域网链路实现真正的实时文件复制,并实现文件locking。 我们目前在东海岸的办事处有一个16驱动的SAN设置。 我们在科罗拉多州也有一个办公室,有相同的准确的SAN设置。 这个想法是让这两个SAN在任何时候都包含相同的确切数据,这将允许我们使用相同的数据池,并且如果两端都出现故障,还可以使用非现场备份解决scheme。 我们正在运行Server 2008。

目的是使东海岸办事处的用户能够处理文件,并在科罗拉多州的SAN上即时更新这些更改。 我们还需要在那里进行文件locking,以便在用户尝试使用同一个文件时不会发生冲突或覆盖更改。

这是甚至可能的情况下,以使文件可用的速度? 如果是这样,我们需要什么软件来取消这个? 据我了解,DFS-R不提供文件lockingfunction,所以如果我们使用这个function,我们需要使用像Peerlock这样的第三方产品。 但是我甚至不知道DFS-R是否是一个选项。 它可以通过广域网连接快速复制吗? 可以任何产品? 看来,如果我们要使用同步复制,程序将会慢得令人无法接受,因为每个写入都必须等待链接另一端的确认。 但是,如果我们使用asynchronous复制,我们将看到什么样的延迟? GlobalScape有一个名为WAFS的产品,声称它提供了“实时文件locking,文件释放和同步的文件一致性”,并表示“随着文件被修改,使用智能字节级差异立即镜像更改以最小化对networking带宽的影响“。 所以这听起来像是同步复制,但是由于物理限制,例如光速,这似乎不可能。

如果任何人有这种设置的经验,或知道是否有可能,我会感谢您的意见和build议,包括我们应该检查的软件的build议。

是否可能取决于两个(也许是3)的东西:

  1. 变化率(即你每天有多less块积木)和
  2. 链接两个站点之间的带宽。
  3. 您需要复制的原始数据

如果您的变化率太高,则数据的压缩量无法帮助您复制。

对于大量的数据,变化率较低,链接速度较慢,联邦快递有可能用“种子”数据驱动,以便在复制上取得良好的开局。 除此之外,没有打破物理定律。

查看Riverbed Steelhead设备,以协助办公室之间的延迟。 他们还有其他一些干净的方式来pipe理远程办公室的数据。 当然,您的解决scheme还有其他部分,但是这些设备在我们的scheme中确实有帮助。 河床

在每个站点部署一台Linux服务器(可以是虚拟机),并设置Samba,将其configuration为使用http://wiki.apache.org/hadoop/MountableHDFS根目录。 HDFS将执行复制和locking。