监视突发RAID驱动器故障

一个运行CentOS的专用服务器上的双盘软件RAID-1arrays中的硬盘在这个周末突然失败,整个服务器都closures了。 虽然我没有时间来审查日志和完整的监测,似乎没有任何警告(虽然我没有专门监视袭击)。 由于我是RAID新手,并且对失败有几个疑问:

  1. 如果RAID中的磁盘故障通常会closures服务器? 我的理解是,RAID是专门为了防止这一点。
  2. 在查看日志时,是否有任何日志或事物,特别是我应该寻找的原因或前兆?
  3. 我以后应该如何监控我的RAID? 是看/proc/mdstat足够?

通常,磁盘故障不会导致系统closures。 我有几个磁盘故障,我刚刚收到一封电子邮件,说磁盘失败,arrays被标记为降级,我应该改变驱动器。

我会研究/ var / log / messages,因为这是通常这种东西去的地方。 如果你想事先得到通知,你应该安装智能工具。 他们会发送你和电子邮件,如果有可能会失败。

我会看/ proc / mdstat,设置电子邮件警报,并使用智能来监视驱动器。 然后,您还可以使用智能设置每周驾驶testing。