我的Ubuntu Linux服务器有一个带有4个2TB SATA磁盘的mdadmarrays(RAID 5),可以不时地“松动”两个磁盘。 到目前为止,重新启动和重新组装数组已经很好了。
硬件是带有Exsys EX-3400卡的Dell PowerEdge T20,提供四个额外的SATA端口。 RAIDarrays中的四个磁盘中的两个连接到Exsys卡,其余两个磁盘连接到板载SATA端口(剩余的板载SATA端口用于其他磁盘)。 我使用智能工具检查磁盘故障,他们都看起来不错。
从RAID中“丢失”的磁盘是连接到附加SATA控制器的两个磁盘,所以我用另一个replace了附加卡(没有帮助,相同的症状)。 我更换了相关磁盘的SATA电缆(没有帮助,相同的症状)。
有没有人有一个想法是什么来源这些问题可能是,我还能testing什么?
它不是mdadm,mdadm只控制基于内核的软件RAIDfunction。
您不需要重新启动即可重组数组。 (也许只有当它是你的根分区。)
把相应的内核消息(你可以用dmesg命令得到它们)帮助很多,尽pipe我可以肯定地说,问题的原因是什么。 而且这可能是电源,尽pipe你说问题只在连接的控制器上。
如果是电源问题,您可以轻松地进行testing:只在额外的SATA和原始设备之间插入数据电缆。 问题是否仅在附加控制器上发生?
如果没有:有电源问题,您需要find一个电源解决scheme。 在“正常”的硬件中,我会买一个更好的电源,在你的情况下,我build议问一个新的,更多硬件的问题。
如果问题出现,则总是在每个电源/数据线configuration中,在附加卡上:那么问题可能在于卡。 尝试获得一个新的,或不同的types。
Ps你可以随意插上电源线和数据线,linux软件raid很聪明,可以识别硬件设备(他通过raid超级块中的自动生成的密钥来做这件事)。
我尝试了所有上述提示。 即使交换电缆(电源,SATA)也没有改变症状。 连接到附加SATA控制器的两个磁盘不断从mdadmarrays丢失,所以我尝试了另一个SATA控制器。 没有运气。 我最终重新整理了整个机器,这样我就可以在没有附加SATA控制器的情况下工作。 现在mdadmarrays已经稳定了好几天了,我希望它能保持稳定。