Ubuntu:监视硬件RAID并在失败时通知?

我在某些新的Ubuntu 10.04 x64服​​务器上使用3ware 9650SE-2LP Raid控制器进行2驱动器RAID 1设置。

当其中一个驱动器出现故障时,服务器是否可以向我发送通知? 如果可能的话,我更喜欢电子邮件通知。 谢谢。

3ware提供3dm2监控/pipe理程序。 只要看看他们的网页,有一个二进制版本的Linux,它甚至工作正常[至less在debian下]。

事情是 – 我从来不相信那些奇特的工具…所以我做如下。 所以我使用基于tw_cli的自己的脚本 – 也可以从3ware网站下载。

每周一次我运行巡逻阅读:

./tw_cli /c0/u0 start verify 

和所有的时间,每15分钟我倾倒当前状态的突袭:

 ./tw_cli /c0 show > current.txt 

我使用非常简单的nagios插件来检查当前状态是否与预期相同[我只是将文件内容与开始时已知的状态转储进行比较]。

 #!/bin/bash if [ `diff current.txt expected.txt|wc -l` -ne 0 ] ; then echo "CRITICAL - current state of raid does not match expected pattern " exit 2 fi if [ `find . -name current.txt -mmin -16|wc -l` -ne 1 ] ; then echo "CRITICAL - state file is old " exit 2 fi echo "OK" exit 0 

你可能会把邮件,而不是退出2 …甚至更可能使用3dm2。