存储空间失败的磁盘 – 卷脱机

在推送到磁带之前,我们已经build立了一个廉价的物理服务器和一堆3TB磁盘作为备份暂存区域。 我们已经安装了Windows Server 2012 R2并设置了存储空间/池。 我们使用Veeam备份到运行在光纤通道上的更快的服务器,然后使用脚本将早于x天的备份移动到我们的Storage Spaces服务器。

最初我们发生了一些故障,因为我们发现使用Robocopy通过UNCpath移动数据没有正常closuresSMB连接。 我们通过在脚本中添加net use和net use / delete(然后使用驱动器盘符作为Robocopy目标)来解决此问题。 这在过去的一两周里效果很好。

今天早上,尽pipe脚本报告失败。 经过调查,我发现了一系列事件ID 51警告,其次是事件ID 134(来自ReFS)。 这在我看来就像存储池中的物理磁盘出现故障。 然而,在服务器pipe理器中,它显示虚拟磁盘/卷/不知道该把它称为“离线”。 只需将其恢复为联机状态即可,并且存储池中没有发生故障的物理磁盘。 还有两个热备份,这两个都没有交换。

我很好奇这里发生了什么? 还有为什么卷会脱机? 我认为ReFS和存储池的全部意义在于提供这种失败的依赖吗?

编辑:添加下面的所有相关的日志。

<Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event"> <System> <Provider Name="disk" /> <EventID Qualifiers="32772">51</EventID> <Level>3</Level> <Task>0</Task> <Keywords>0x80000000000000</Keywords> <TimeCreated SystemTime="2014-12-23T22:13:12.704827200Z" /> <EventRecordID>23901</EventRecordID> <Channel>System</Channel> <Computer>****</Computer> <Security /> </System> <EventData> <Data>\Device\Harddisk25\DR25</Data> <Binary>040080000100000000000000330004802D0100006B0400C000000000000000000000000000000000FC8F470200000000FFFFFFFF0100000058000030020000000020101280032040000080003C000000000020AB09E0FFFF783583D201E0FFFF0000000000000000507383D201E0FFFF30C99FC108E0FFFF6B0400C0000000008A00000000027C288D60000008000000000000000000000000000000000000000000000000000000</Binary> </EventData> </Event> 

设备\ Device \ Harddisk25 \ DR25在分页操作期间检测到错误。

仅供参考Disk25是由存储空间创build的虚拟磁盘,不是物理磁盘之一

 <Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event"> <System> <Provider Name="ReFS" Guid="{036647D2-2FB0-4E32-8349-3F5C19C16E5E}" /> <EventID>134</EventID> <Version>0</Version> <Level>2</Level> <Task>0</Task> <Opcode>0</Opcode> <Keywords>0x8000000000000000</Keywords> <TimeCreated SystemTime="2014-12-23T22:13:13.329846900Z" /> <EventRecordID>23902</EventRecordID> <Correlation /> <Execution ProcessID="4" ThreadID="31267444" /> <Channel>System</Channel> <Computer>COMSTOR.muh.uni.mq.edu.au</Computer> <Security UserID="S-1-5-18" /> </System> <EventData> <Data Name="VolumeIdLength">2</Data> <Data Name="VolumeId">D:</Data> <Data Name="FailureReason">0xc000000e</Data> </EventData> </Event> 

文件系统无法将元数据写入介质支持卷D :. 写入失败,状态为“指定了不存在的设备”。 ReFS将使卷脱机。 它可以自动重新安装。

  <Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event"> <System> <Provider Name="Microsoft-Windows-StorageSpaces-Driver" Guid="{595F7F52-C90A-4026-A125-8EB5E083F15E}" /> <EventID>304</EventID> <Version>0</Version> <Level>3</Level> <Task>0</Task> <Opcode>0</Opcode> <Keywords>0x8000000000000000</Keywords> <TimeCreated SystemTime="2014-12-30T23:43:40.519688500Z" /> <EventRecordID>21</EventRecordID> <Correlation /> <Execution ProcessID="4" ThreadID="3723912" /> <Channel>Microsoft-Windows-StorageSpaces-Driver/Operational</Channel> <Computer>****</Computer> <Security UserID="S-1-5-18" /> </System> <EventData> <Data Name="Id">{DE94C7EF-6A25-11E4-80B7-647002019326}</Data> </EventData> </Event> 

虚拟磁盘{de94c7ef-6a25-11e4-80b7-647002019326}处于降级状态。 托pipe虚拟磁盘的物理磁盘发生故障,断开连接或遇到写入错误时,可能会发生这种情况。

Windows将尝试修复虚拟磁盘。 目前不需要采取行动。

假设你确实使用了奇偶校验或镜像等容错模式,那么这个错误是不可能的。 我能够在一个带有磁盘的条带化设置中重现这个错误,我知道这个错误是不好的。 因此,无论是设置条纹,还是发现错误。 如果你还没有,我会在这个时候介入微软。

经过与Microsoft技术支持工程师长时间的电子邮件讨论后,我们最终安装了以下汇总更新:

http://support.microsoft.com/kb/2887595

这包括一个似乎专门针对这个问题的更新:

https://support.microsoft.com/en-us/kb/2897150

自安装累积更新以来,卷一直保持在线,没有任何问题。