我有一个刚刚超过一个月的NAS设备。 它被configuration为通过电子邮件发送从硬盘驱动器的SMART数据生成的警报。 有一天,其中一个硬盘报告说一个部门坏了,被重新分配。 在第一周内,这个数字攀升到硬盘驱动器总数的六倍。 一个月后,这个数字是九个重新分配的部门。 速度肯定似乎在减速。
NASconfiguration了6个1.5 TB的RAID-5configuration的驱动器。 有了这样的高容量驱动,我预计会有一个部门不时地失败,所以我并不担心前几个部门何时搬迁。 这让我感到困扰,但其他磁盘都没有报告任何问题。
搬迁的次数或总搬迁次数,我是否应该开始担心车辆的健康? 这可能会根据驱动器的容量而变化吗?
与大多数组件一样,驱动器具有浴盆曲线故障率。 他们一开始就失败了很多,中间的失败率相对较低,到了生命的尽头就失败了很多。
就像整个驱动器沿着这条曲线一样,磁盘的特定区域也将沿着这条曲线。 在使用驱动器之初,您会看到很多扇区重新分配,但这应该逐渐减less。 当驱动器在寿命结束时开始失效时,它将开始失去越来越多的部门。
您不需要担心6(取决于驱动器 – 咨询制造商),但是您需要观察并查看每个新的重新分配的频率。 如果恶化加速或保持不变,请放心。 否则,在初始磨合期后应该没事。
-亚当
重新阅读谷歌关于这个问题的论文“ 大型磁盘驱动器人口的失败趋势 ”,我想我可以放心地说,亚当的答案是不正确的。 在对极其庞大的驱动力群体的分析中,约有9%的重新分配数量非零。 这句话是这样的:
在第一次重新分配之后,驱动器在60天内失败的可能性比没有重新分配计数的驱动器高14倍,这个参数的临界值也是1。
在处理“脱机重新分配”时,处理驱动器的后台清理期间发现的重新分配,而不是在实际请求的IO操作期间处理更为有趣。 他们的结论:
在第一次脱机重新分配后,驱动器在60天内失败的几率比没有脱机重新分配的驱动器高出21倍以上; 这个效应比总的重新分配更为剧烈。
从现在开始,我的政策是将计划replace为非零重新分配的驱动器。
不同的硬盘可能有不同的参数。 在我上次检查的一个驱动器上,这个驱动器是来自一个供应商的1TB企业系列磁盘,有2048个保留扇区用于重新分配。
您可以估算在已重新分配的扇区数不为零的驱动器上SMART报告中预留扇区的数量。 考虑下面的一个失败的驱动器的报告。
... ID# ATTRIBUTE_NAME VALUE WORST THRESH TYPE WHEN_FAILED RAW ... 5 Reallocated_Sector_Ct 005 005 036 Pre-fail FAILING_NOW 1955
这里95%的预留容量已被使用,即1955个扇区。 因此,初始容量大约是2057年,实际上是2048年,这个差别是由于舍入误差。
当重新分配扇区的数量达到一定的阈值时,SMART将驱动器置于故障状态。 对于有问题的驱动器,该阈值设置为保留容量的64%。 这大概是1310个重新映射的部门。
然而,保留部门并不是连续的跨度。 相反,它们被分成几个组,每个组都被用于从磁盘的特定部分重新映射扇区。 这样做是为了将数据保存在磁盘上的某个区域。
局部的缺点是磁盘可能有很多保留扇区。 然而,一个地区可能已经用尽了预留容量。 在这种情况下,行为取决于固件。 在一个驱动器上,我们观察到它进入FAILED状态,并且在不再受保护的部分发生错误时阻止。
如果驱动器支持,您可能需要运行SMART长时间自检。 这可能会提供有关驱动器状态的更多信息。 如果您的NAS无法做到这一点,并且您可以将硬盘拔出或closuresNAS几个小时,则可以将硬盘插入另一台机器进行长时间的自检。
当这个新的驱动器像这样的行为,这是不可信的!
尽快将其发回,并获得更换驱动器。
不同的制造商有不同的“可接受的损失”数字(与监视器和坏像素相同的想法)。 请与驱动器制造商联系,了解他们的标准是什么。
这看起来像一个不好的趋势,但…
西部数据公司特别为能够在可接受的时间内恢复坏扇区而非冻结磁盘放置在RAID中的技术而自豪,其名称为TLER( http://en.wikipedia.org/wiki/Time-Limited_Error_Recovery )。 时间通常是5..7秒。
正如我在网上发现有WD磁盘驱动器禁用选项,但一些人民启用这个function便宜的绿色西部数据驱动器,然后将其放入RAID。
从WD支持网站删除WDTLER实用程序,但可以通过Google轻松发现。
PS我只使用此实用程序的阅读状态,我现在不使用RAID