我使用ZOL版本v0.6.5.4运行Ubuntu 14.04:
root@box ~# dmesg | egrep "SPL|ZFS" [ 34.430404] SPL: Loaded module v0.6.5.4-1~trusty [ 34.475743] ZFS: Loaded module v0.6.5.4-1~trusty, ZFS pool version 5000, ZFS filesystem version 5
ZFS在raidz2中configuration为跨6个2TB希捷SpinPoint M9T 2.5英寸硬盘,具有读caching,重复数据删除和压缩function:
root@box ~# zpool status -v pool: bigpool state: ONLINE config: NAME STATE READ WRITE CKSUM bigpool ONLINE 0 0 0 raidz2-0 ONLINE 0 0 0 ata-ST2000LM003_HN-M201RAD_S37<redactedid> ONLINE 0 0 0 ata-ST2000LM003_HN-M201RAD_S37<redactedid> ONLINE 0 0 0 ata-ST2000LM003_HN-M201RAD_S37<redactedid> ONLINE 0 0 0 ata-ST2000LM003_HN-M201RAD_S37<redactedid> ONLINE 0 0 0 ata-ST2000LM003_HN-M201RAD_S37<redactedid> ONLINE 0 0 0 ata-ST2000LM003_HN-M201RAD_S34<redactedid> ONLINE 0 0 0 cache sda3 ONLINE 0 0 0
每隔几天,盒子就会locking,我会得到如下错误:
blk_update_request: I/O Error, dev sdh, sector 764218200 blk_update_request: I/O Error, dev sdf, sector 764218200 blk_update_request: I/O Error, dev sde, sector 764218200 blk_update_request: I/O Error, dev sdd, sector 764218200 blk_update_request: I/O Error, dev sdc, sector 764218432 blk_update_request: I/O Error, dev sdg, sector 764218200
smartctl显示磁盘不logging任何SMART错误,而且它们都是相当新的磁盘。 我觉得奇怪的是,他们都在同一个领域失败(除了SDC)。 我能够抓住terminal的屏幕截图(一旦错误开始,我不能ssh):
控制台错误
也许这是一个控制器失败,或与zfs相关的错误?
你有一个控制器,布线或背板问题。 请注意所有驱动器如何同时受到影响
除非完全有必要,否则我也不要在这样的设置上使用重复数据删除。