有一个情况,我们在外面的客户,我想更好地了解。
以下是发生的事情:
我没有关于设备供应商的细节。
似乎磁带驱动器上发生了重置,导致磁带倒带,但是这种情况并没有报告给驱动程序和软件的错误,所以软件假定写入成功。
我正在阅读大量的文档,以了解为什么发生这种情况,但我无法做出任何最终结论来帮助客户。
如果有人能为我提供一些指导,我将非常感激。
这是磁带驱动器的一个已知问题,它们的方式很简单 – 仅通过侧视设备(即以错误的方式打开它 – 通过倒带设备 – 例如检查状态),容易倒带。
至less有一个主要的UNIX备份软件如此担心,以至于它拒绝在磁带准备好被擦除之前再次写入磁带; 这从amanda常见问题解答 (具体提到巴士重置作为一个问题区域):
为什么阿曼达不附带录音带?
阿曼达一次=一个(一套)磁带。 Amanda打开磁带设备一次,写入所有图像和文件标记,然后closures设备一次。 使用该序列,其他程序不可能中断该序列并倒带,而没有Amanda注意到。
做“mt -f / dev / st0状态”就足够了,甚至“每天都在检查”。 而且,像scsi总线重置这样的错误意味着倒带。
如果Amanda将closures并重新打开每个备份映像的磁带驱动器,则会出现一个漏洞窗口,意外重新引导磁带,下一个映像将覆盖磁带上所有正确的备份。 除非你试图从磁带上恢复,否则你是不会知道的。
当附加到磁带上时,有可能在Amanda放置到最后一个图像(已经不是很平凡!)的时间和打开设备写入的时候,磁带倒带发生,在这种情况下,Amanda会愉快地擦除所有磁带,包含可能许多天值得的备份。
Bacula同样通过永不closures磁带设备来解决这个问题,所以没有人可以在磁带加载时错误地打开磁带设备。 但是这并没有解决总线复位问题。
本质上,这是一个问题,而且是一个难题。 我可能会争辩说,你的备份硬件应该足够坚固以至于不会经常发生; 如果FC看起来特别容易出现这种情况,那么现在是时候拿一个SAS磁带驱动器,或者至less直接将磁带设备连接到备份服务器,以便从path上移除光纤交换机等。 除此之外,我看不出你能做多得多,因为你在通常的问题之前就已经发现了问题,比如“ 我们的恢复不行,我们被搞砸了 ”。