LSI MegaRAID:与PD通信时检测到瞬态错误: – : – :1是什么意思?

我有一台运行在服务器上的LSI MegaRAID 9260-16i卡,并且logging错误

Controller ID: 0 Transient error detected while communicating with PD: -:-:1 

我找不到任何有关此消息的任何地方(文档,谷歌,论坛等)。 这个消息是什么意思?

显然这个错误是由于使用的磁盘types。 LSI回应了我的支持票:

三星HD103UJ还没有被认定为兼容的硬盘。 错误和随后的超时事件是由于桌面级硬盘驱动器使用的错误报告机制导致的通信问题,而这些硬盘驱动器不适用于RAIDfunction。

我不知道这是一个问题,但经过更多的testing之后,我相信这确实是问题的根源。 我已经改变了背板和SAS电缆没有成功,我已经对操作系统虚拟磁盘(使用企业戴尔磁盘)和数据磁盘(使用桌面三星磁盘)进行“压力”testing,只有在运行“压力“testing数据磁盘我收到这些错误。

所以,我认为这个问题没有别的办法,而是比实际购买企业级磁盘,比如LSI支持的“WesternDigital®RE Enterprise 2TB”。 试图重用硬件非常多。

更新(2013年3月11日)

控制器运行2个arrays,使用WD企业级磁盘的RAID1和使用SAMSUNG桌面磁盘的RAID6。 本周末,RAID1arrays降级。 日志充满了我原来的post提供的错误信息。 奇怪的是,RAID1arrays使用企业磁盘。 难道真的是在其他arrays上的一个SAMSUNG磁盘出现问题,然后其中一个WD磁盘被驱逐到另一个arrays上? 这对我来说似乎是一个奇怪的行为。

更新(2015年5月29日)

我处理这个问题已经有一段时间了。 我相信实际的原因是与电力供应有关。 我连接所有4个背板到相同的电源连接器(使用分离器)。 在峰值时(功耗),磁盘会“掉出”,因为无法提供足够的电量。 我通过简单地将两个电源连接器分别安装在两个背板上来解决这个问题。