两周内在3ware raid上发现有三块ECC错误的磁盘

我有一个服务器,我为客户维护,这是一个基于Intel Nehalem的计算机,所以不是新的,但在工作中。 它有一个连接了20个驱动器和4个空插槽的3ware 9650SE-24M8卡,configuration成5个raid5arrays。 其中三个arrays由2TB驱动器组成,另外两个3TB。 在过去的两周里,我们已经从同一arrays中损失了3个3tb的硬盘,当天又损失了2个硬盘。 我们进行夜间备份,所以没有数据丢失,但是停机时间很昂贵,replace磁盘也是如此。 通过丢失我的意思是卡是报告和ECC错误状态。 2tb驱动器接近25000运行小时,3tbs接近10000运行小时。

环境温度大约是25℃,而驱动器(根据智能)在大约28-30℃空转。 操作系统是Fedora Linux 13 amd64(我一直试图升级六个月,但无法稳定运行,足以为它做好准备)。

我现在不知道该做什么,到目前为止,已经有两个驱动器死亡,都是1TB,相当老,相隔几个月。 帮助还是build议?