Supermicro平台上的DOM模块会导致I / O错误,但在通电/断电后会完全复位

有一个带DOM模块SSD-DM032-SMCMVN1的Supermicro X9DRT-F平台。

Linux定期开始向dmesg报告多个消息:

blk_update_request: I/O error, dev sda, sector .. 

此时,大多数应用程序都崩溃了“分段错误”和“I / O错误”。

但是,closures/打开服务器电源后,DOM会在几个星期或几个月内再次正常工作!

SMART说“一切正常”:

  • https://gist.github.com/ilyaevseev/18a3cbfde3f82b74d29f91093dfe6eac

Badblocks也说“一切都好”

 $ badblocks -sv /dev/sda Checking blocks 0 to 31266647 Checking for bad blocks (read-only test): done Pass completed, 0 bad blocks found. (0/0/0 errors) 

如何解决DOM失败?