您使用什么工具来监控Dell Poweredge 2950(II和III,PERC)上的硬件RAID状态? 我运行Debian。 过去,我使用了dell openmanage的“debianized”版本。 我正在寻找一个轻量级的解决scheme和(如果可能的话)“debian打包”的东西。
任何想法都欢迎!
谢谢
正如womble所说,从该博客文章中获取OMSA包,并使用NRPE调用check_openmanage 。
这样可以很好地覆盖您盒子中的所有戴尔硬件(包括RAIDarrays)
我们在我们的所有戴尔服务器上运行OMSA,然后使用NRPE插件查询这些信息,以生成Nagios处理,graphics,警报等的结果。
不是debian包装..
我使用ipmi通过局域网读取drac日志。 我运行:
ipmitool -L USER -H 10.1.2.3 -U ipmi_username -P password sel elist last 10
这给了我最后10个日志消息。 如果有什么东西 – 可能是奇怪的东西已经发生[记忆错误,多余的死亡等等]
我本地运行MegaCLI来查询RAID状态。 它需要root权限,所以我有cron作业执行:
./MegaCli -AdpAllInfo -aALL|grep -v "Current Time" >> current.txt ./MegaCli -PDList -aALL >> current.txt ./MegaCli AdpBbuCmd -aAll|grep "Aalarm"|grep -v "^Remaining" >> current.txt ./MegaCli -LDInfo -Lall -aALL >> current.txt
而nagios nrpe插件只是比较current.txt与expected.txt,如果不匹配则发出警报。
你可以谷歌为megacli或从lsi网页下载。
OMSA与debian合作,稍微调整一下,并不那么沉重
另一方面你可以设置linux本地工具,或者像Nagios,munin等附加软件包。