我有一个戴尔T7500 PERC H710P连接到RAID5arrays中的4个3T驱动器。 还连接到控制器的是2个256G SSD驱动器,未在arrays中configuration。 一个Linux服务器安装在其中一个SSD驱动器上,而RAID5则是我所有用户数据的存储位置。
在启动的那一天,RAID BIOS报告了错误
Drives 01 and 03 missing Foreign config available
我加载了外部configuration,驱动器重新出现。 在下一次启动时,我得到了
Drive 01 offline
认为驱动器是坏的,我用一个新的驱动器取代了它,并重新驱动器01.当我下一次启动,系统来了好,但几次重新启动后,我得到
Drive 00 offline Foreign config available
所以我读了外国configuration,并强制00在线。
几次重启后,我得到了
Drive 03 offline Foreign config available
阅读外部configuration。 强制驱动03在线。
现在系统启动了。 我重新启动了很多次。
我应该认为我的控制器不好吗?
或者换句话说,这种行为是否有可能是由控制器以外的其他因素造成的? 例如,内核驱动程序可以以某种方式清理驱动程序configuration?
是的,我相信你的控制器或RAID背板是坏的。 但我认为控制者是罪魁祸首。 您可以查看RAID控制器的固件版本(不要与您应该检查的系统BIOS混淆),并与戴尔网站上提供的内容进行比较? 您可能会发现该版本已经过时,而且新版本中已经解决了关键问题。 或者,您可以尝试致电戴尔支持 – 如果支持可用,您应该这样做! 您可以通过在support.dell.com上查找服务标签来轻松查看哪些服务合同有效。
两个注意事项。 你处于危险的境地。 升级RAID控制器固件有时会导致数据丢失 – 确保新版本已经出现一段时间,并仔细阅读发行说明。 2)RAID 5不给你很多的回旋余地。 无论哪种方式,准备备份您的关键数据之前,让你的时间通过这个问题,或采取任何实质性的纠正措施!
除了由whitepaws提供的重要build议(获得备份,更新固件等),如果您仍在保修期内,您可以考虑联系Dell支持。 控制器日志有可能会有更多关于正在发生的事情的信息,并且可能会帮助您找出问题的潜在原因。
在更直接的回答你的问题…是的,这是可行的,除了控制器本身之外的东西可能会导致问题(即一个坏的驱动程序,如果你碰巧足够年龄)。 这不太可能,但是控制器本身或其他硬件的问题更有可能。 有时候1个坏磁盘可能会导致所有其他磁盘出现问题 – 这是我们在控制器日志中检查的。
如果您想要提取日志,则可以使用更复杂的pipe理选项。
如果您在启动期间拥有UEFI Bios,则可以在其中configuration日志logging。 这在手册中描述: ftp : //ftp.dell.com/manuals/all-products/esuprt_ser_stor_net/esuprt_dell_adapters/poweredge-rc-h310_User%27s%20Guide_en-us.pdf
您也可以安装OpenManage并以这种方式获取信息: http : //linux.dell.com/wiki/index.php/Repository/hardware
我会第三个备份的build议。 备份,备份,备份。 在2013年,由于面密度高,文件系统错误以及固态硬盘的特性,实际上从损坏的硬盘中恢复数据几乎是不可能的。 假设在任何失败期间总数据丢失。
即使RAID 5现在也被认为是有风险的。 或者RAID。 我反复遇到了控制器故障中的问题,这些问题会破坏基本RAID 1镜像arrays和变体(RAID 10)中的两个驱动器。 与RAID 5和RAID 6相同的问题。
现在认为最好的做法是使用主要用于RAID 0 Striping的RAID,并使用备份软件使用完全独立的系统(单独的驱动器/arrays)进行备份。
换句话说,与创build镜像arrays相比,通常认为将单个硬盘驱动器备份到外部USB硬盘驱动器会更好。