除非冷/硬启动,否则SSD不会被检测/脱机

我在一台服务器上用了一年多的SSD。 有一段时间,服务器将蓝屏/完全没有响应。 我发现SSD在系统运行时会脱机,因为在重新启动(软复位)之后,BIOS不会检测到SSD – 除非我完全closures系统电源并重新打开。 然后检测到SSD。 我换了电缆等。这是什么原因? 它可能是一个坏的SSD? (没有任何意义,它只是“离线”)。 运行Windows Server 2008 …日志也不告诉我任何事情。

这是一个OCZ oynx,固件是最新的。 我的HDTune结果显示它有很多坏道,但我不确定我是否相信结果。

编辑

高清哨兵表面testing显示约19个坏道。 一旦我得到我的备份SSD(海盗船),我会重新格式化/重新初始化,看看是否可以解决这个问题。

最可能的原因:

  1. Buggy固件。 固态硬盘尤其相对而言是非常“新”的,而固件在旋转防锈硬件的固件上已经有了几十年的testing和发展。 这就是为什么很多人仍然推荐英特尔固态硬盘与其他品牌的价格/容量或价格/性能更好:英特尔固态硬盘已被certificate具有非常可靠的固件,而其他大多数品牌已经有灾难性(数据丢失)的错误。 如果您运行的是最新版本的固件,您只需打开一个支持OCZ的支持案例,并提供他们要求的任何诊断数据。
  2. Buggy的SATA / SAS驱动程序:检查更新(你不提到一个操作系统,但我假设Windows)。 支持像TRIM这样的function在一段时间内是相当不稳定的。
  3. Buggy的BIOS / RAID固件:确保这些是在您的制造商\
  4. 驱动器的实际硬件问题,无论是在控制器,闪存芯片,甚至在PCB或连接器上。 你所能做的就是RMA驱动器。

SSD上的扇区没有映射到实际扇区。 当您写入“扇区”时,SSD的固件实际上是将该数据写入底层SSD的尚未使用的部分。 它会一直select最less的部分,来完成“磨损平衡”。 也就是说,除非出现问题,否则没有磁盘工具可以看到坏道。 我build议更换驱动器,看看是否有帮助。

顺便说一下:每个SSD的出货量比它在操作系统轮询时实际声称的要多一些。 当真正的扇区由于太多的写入而开始死亡时,使用这个额外的缓冲空间。 这与写入平衡相结合,就是为什么SSD制造商声称他们的设备具有相同的,如果不是一个较长的平均故障间隔时间作为物理驱动器。 如果您的写入负载非常高,但这可能不是真的。