光纤通道:总线重置时覆盖LTO磁带

有一个情况,我们在外面的客户,我想更好地了解。

以下是发生的事情:

  • 带有LTO磁带机的磁带库连接到光纤通道环境
  • 运行在Windows Server 2008上的归档软件正在将数据写入磁带
  • 在某个时候,磁带被重新卷回,软件没有意识到这一点,写入抹去磁带
  • 通过比较磁带上的预期位置和实际位置来检测情况

我没有关于设备供应商的细节。

似乎磁带驱动器上发生了重置,导致磁带倒带,但是这种情况并没有报告给驱动程序和软件的错误,所以软件假定写入成功。

我正在阅读大量的文档,以了解为什么发生这种情况,但我无法做出任何最终结论来帮助客户。

  • FC HBA或交换机可以重新启动SCSI写入总线复位?
    • 可以这样的事情是可configuration的?
  • FC HBA或交换机是否忽略报告的单元注意?
  • 操作系统的驱动程序可以责怪?
  • 这个供应商是特定的?

如果有人能为我提供一些指导,我将非常感激。

这是磁带驱动器的一个已知问题,它们的方式很简单 – 仅通过侧视设备(即以错误的方式打开它 – 通过倒带设备 – 例如检查状态),容易倒带。

至less有一个主要的UNIX备份软件如此担心,以至于它拒绝在磁带准备好被擦除之前再次写入磁带; 这从amanda常见问题解答 (具体提到巴士重置作为一个问题区域):

为什么阿曼达不附带录音带?

阿曼达一次=一个(一套)磁带。 Amanda打开磁带设备一次,写入所有图像和文件标记,然后closures设备一次。 使用该序列,其他程序不可能中断该序列并倒带,而没有Amanda注意到。

做“mt -f / dev / st0状态”就足够了,甚至“每天都在检查”。 而且,像scsi总线重置这样的错误意味着倒带。

如果Amanda将closures并重新打开每个备份映像的磁带驱动器,则会出现一个漏洞窗口,意外重新引导磁带,下一个映像将覆盖磁带上所有正确的备份。 除非你试图从磁带上恢复,否则你是不会知道的。

当附加到磁带上时,有可能在Amanda放置到最后一个图像(已经不是很平凡!)的时间和打开设备写入的时候,磁带倒带发生,在这种情况下,Amanda会愉快地擦除所有磁带,包含可能许多天值得的备份。

Bacula同样通过永不closures磁带设备来解决这个问题,所以没有人可以在磁带加载时错误地打开磁带设备。 但是这并没有解决总线复位问题。

本质上,这一个问题,而且一个难题。 我可能会争辩说,你的备份硬件应该足够坚固以至于不会经常发生; 如果FC看起来特别容易出现这种情况,那么现在是时候拿一个SAS磁带驱动器,或者至less直接将磁带设备连接到备份服务器,以便从path上移除光纤交换机等。 除此之外,我看不出你能做多得多,因为你在通常的问题之前就已经发现了问题,比如“ 我们的恢复不行,我们被搞砸了 ”。