如果在RAID 1中有2个驱动器,并且RAID控制器出现故障,是否意味着服务器上的网站将会停机,直到更换控制器为止? 还是一切仍然作为软件RAID自动进行,直到故障的RAID卡被更换?
还是一切仍然作为软件RAID自动进行,直到故障的RAID卡被更换?
这将如何工作? 这个软件会不可思议地绕过作为磁盘控制器的硬件RAID? 操作系统不仅看不到磁盘,而且还实际上连接到硬件RAID控制器。 如果控制器发生故障,那么您的磁盘连接失败。
所以不,你下去。 这就是为什么小型设置从云产品中获得很多收益,而大型设置则有多台服务器。
RAID控制器失败
我是一名电子工程师,所以我对“失败”这个词的想法可能与软件工程师有所不同。我的意思是,你们多久会戴上安全眼镜进行debugging?
如果你的RAID控制器主板有任何硬件故障,包括短路的MOSFET,钽电容器爆裂成火球,电源故障等等,很多事情都可能发生,比如你的服务器的电源由于检测到短路而closures。 在这种情况下,一切都会下降。
如果RAID卡上的主芯片突然死机,接下来发生的事情很大程度上取决于操作系统和驱动程序如何处理外设突然意外死亡。 例如,我有一个死硬盘的电脑。 当操作系统等待硬盘响应时,电脑冻结了一段时间。
编写操作系统和驱动程序的人通常在工作硬件上做这件事。 所以处理“扩展卡CPU起火”的代码从来没有被debugging过。 不能责怪他们。 生活的事实。
这次我devise了一个USB外设。 我很快发现,我必须用一台垃圾电脑来debugging,因为如果我的USB外围设备太差了,操作系统就会进入OMFG并崩溃和/或重新启动。
底线,一台PC内部出现硬件故障的卡可以有任何forms的后果,从无到有,内核恐慌或完全closures。 所以没有办法回答你的问题。 RAID卡故障类似于主板故障。 唯一重要的是把数据拿回来。
你要么安装软件RAID或硬件。 软件不能神奇地拾取,因为软件将RAID 1中的两个磁盘视为单个磁盘。 它不知道卡后面的物理磁盘。 它只知道什么RAID卡提供给操作系统。
所以要回答你的问题,如果突袭卡失败,那么服务器正在下降。 对于突袭卡来说,这是非常罕见的。
如果你确实需要这种可用性,那么我build议你看看Stratus技术ftServer,99.999%的正常运行时间。 你可以使用大多数的操作系统,你不需要改变应用程序中的东西。
我在10年前就在那里从事内部存储工作。 我们可以惊奇地移除任何设备(字面上每当发生pci reset时),检测到故障并且故障切换到辅助中断服务。 它通过使用锁步技术来实现这一点。
然而,这是昂贵的,但不是离谱的; 3-4倍的等效服务器的成本。 通常购买这些产品的人会以每秒几万美元的价格来衡量他们的宕机时间,或者生活受到威胁。