两周内在3ware raid上发现有三块ECC错误的磁盘服务器 Gind.cn

我有一个服务器，我为客户维护，这是一个基于Intel Nehalem的计算机，所以不是新的，但在工作中。它有一个连接了20个驱动器和4个空插槽的3ware 9650SE-24M8卡，configuration成5个raid5arrays。其中三个arrays由2TB驱动器组成，另外两个3TB。在过去的两周里，我们已经从同一arrays中损失了3个3tb的硬盘，当天又损失了2个硬盘。我们进行夜间备份，所以没有数据丢失，但是停机时间很昂贵，replace磁盘也是如此。通过丢失我的意思是卡是报告和ECC错误状态。 2tb驱动器接近25000运行小时，3tbs接近10000运行小时。

环境温度大约是25℃，而驱动器（根据智能）在大约28-30℃空转。操作系统是Fedora Linux 13 amd64（我一直试图升级六个月，但无法稳定运行，足以为它做好准备）。

我现在不知道该做什么，到目前为止，已经有两个驱动器死亡，都是1TB，相当老，相隔几个月。帮助还是build议？