如何从“无效驱动器移动”(HP SmartArray P411)

由于飓风马修,我们公司closures所有服务器两天。 其中一台服务器是连接了HP StorageWorks MSA60的ESXi主机。

当我们将事情备份到今天并login到vSphere客户端时,我们注意到我们的访客虚拟机都不可用(它们都被列为“无法访问”)。 当我查看vSphere中的硬件状态时,arrays控制器和所有连接的驱动器显示为“正常”,但驱动器都显示为“未configuration的磁盘”。

我们重新启动了服务器,并试图进入RAIDconfiguration实用程序,看看有什么东西看起来像,但我们收到以下消息:

POST期间报告了无效的驱动器移动。 驱动器移动无效后对arraysconfiguration的修改将导致原有逻辑驱动器的旧configuration信息和内容丢失

在这里输入图像描述

不用说,我们很困惑,因为没有什么“感动”。 没有改变。 我们只是给MSA和服务器通电,一直有这个问题。

MSA通过一条SAS电缆连接,驱动器贴有标签,所以我知道驱动器没有移动或切换:

--------------------- | 01 | 04 | 07 | 10 | --------------------- | 02 | 05 | 08 | 11 | --------------------- | 03 | 06 | 09 | 12 | --------------------- 

目前,我不知道硬盘是什么型号和型号,但都是1TB SAS硬盘。

我有两个主要问题/关注点:

  1. 由于我们没有做任何事情而只是closures和重新启动设备,可能会导致这种情况发生? 我当然可以select重build数组并重新开始,但是我对这种情况再次发生的可能性持怀疑态度(尤其是因为我不知道是什么原因造成的)。

  2. 有没有雪球的机会,我可以恢复我们的arrays和访客虚拟机,而不是重build一切,恢复我们的虚拟机备份?

对,这是一个非常危险的情况…

因此,HP Smart Array控制器可以在中断arraysconfiguration之前处理一定数量的物理驱动器移动。 请记住,HP RAID元数据位于物理驱动器上,而不是控制器上。

MSA60是一款12槽3.5英寸的第一代SAS JBOD机箱,在2008/2009年达到了使用寿命,已经够年限了,所以它不应该成为今天任何 vSphere部署的关键path。

在这种情况下,P411控制器正试图保护您。 您可能会遇到多驱动器故障,遇到固件问题,丢失MSA60后部的两个控制器接口之一或其他奇怪的错误。

这听起来像是一个较旧的服务器设置。 所以我想知道所涉及的服务器和Smart Array P411固件版本。


我build议删除所有组件的权力。 等待几分钟。 开机…并密切观看POST提示。

请参阅我的答案在这里的细节:
重新启动后无法识别HP Smart Array P800上的逻辑驱动器

可能有一个选项来重新启用以前发生故障的逻辑驱动器,并可以select按F1F2 。 如果出现,请尝试F2

你们不会相信这个…

首先,我尝试重新启动现有MSA,等待几分钟,然后启动ESXi主机,但问题依然存在。 然后closures主机和MSA,将驱动器移入备用MSA,启动,等待几分钟,然后启动ESXi主机; 这个问题依然存在。

在那个时候,我觉得我非常麻烦,在RAID控制器的初始化过程中没有任何东西可以select重新启用失败的逻辑驱动器。 因此,我启动到RAIDconfiguration,再次validation没有逻辑驱动器存在,并且我创build了一个新的逻辑驱动器(带有两个备用驱动器的RAID 1 + 0;与我们大约2年前第一次安装此主机时一样存储)。

然后我让服务器重新启动到vSphere,并通过vCenter访问它。 我做的第一件事是从库存中删除主机,然后重新添加它(我希望以这种方式清除所有无法访问的虚拟机,但没有从清单中清除它们)。 一旦主机回到我的库存中,我一次一个地移除每个访客虚拟机。 清除清单后,我确认没有数据存储,并且磁盘已基本就绪,正在等待“数据磁盘”。 所以我继续创build一个新的数据存储(与我们几年前使用VMFS时一样)。 我最终被提示指定一个挂载选项,我可以select“保留现有的签名”。 在这一点上,我认为保持签名是值得的 – 如果事情没有解决,我总是可以把它吹走,重新创build数据存储。 在完成使用保持签名选项构build数据存储的过程之后,我尝试导航到数据存储以查看是否有任何内容 – 它看起来是空的。 只是出于好奇,我SSH主机,并从那里检查,而我的惊讶,我可以看到我所有的旧数据和所有我的旧客机虚拟机! 我又回到了vCenter,重新扫描了存储并刷新了控制台,我们所有的客户虚拟机都在那里了! 我重新注册每个虚拟机,并能够恢复一切! 我们所有的访客虚拟机都备份并成功地在networking上进行通信。

我认为IT界的大多数人都会认同发生这种事情的机会是极其低下而不可能的。

就我而言,这是神的奇迹。