我有一个服务器与惠普智能arrays硬件RAID控制器。 为了监视它的状态,我使用了cpqarrayd。 /etc/default/cpqarrayd包含DAEMON_OPTS="-t localhost:162"以在发生事件时发送SNMP陷阱。 陷阱由snmptrapd处理,/etc/snmp/snmptrapd.conf包含
disableAuthorization yes traphandle default mailx -s "SNMP Trap" [email protected]
收到的电子邮件包含SNMP陷阱,但它们不是人类可读的,不可能说出它们是什么,或者它们是否由cpqarrayd发布。 当RAID状态改变时,是否可以发送人类可读的电子邮件?
下面的脚本放在cron.hourly中:
#!/bin/sh CCISS_DEVICE=/dev/cciss/c0d1 STATUS_FILE=/var/cciss_vol_status TMP_FILE=$TMPDIR/status-$$.$RANDOM mv $STATUS_FILE $TMP_FILE cciss_vol_status $CCISS_DEVICE >$STATUS_FILE if ! cmp -s $STATUS_FILE $TMP_FILE ; then mailx -s "CCISS status changed" [email protected] <$STATUS_FILE fi rm $TMP_FILE
首先,请参阅: 如何在驱动器出现故障时让我的HP服务器向我发送电子邮件?
简而言之,作为ProLiant或pipe理组件包 (Debian) Service Pack一部分安装的HP SNMPpipe理代理将为您提供正确的系统健康警报。 这包括磁盘,arrays控制器,风扇,温度,电源,国际劳工组织,网卡等陷阱。
Debian完全支持这一点。 您将在HP Software Delivery Repository中find下载内容。
这两个部分( 由安装程序自动configuration ):
在您的snmpd.conf文件中:
# Following entries were added by HP Insight Management Agents at # Thu Mar 18 04:14:43 PDT 2010 dlmod cmaX /usr/lib64/libcmaX64.so
用SNMP注册HP Health Agent。
和/opt/hp/hp-snmp-agents/cma.conf文件:
############################################################ # # cma.conf: HP Insight Management Agents configuration file # ############################################################ ######################################################################## # trapemail is used for configuring email command(s) which will be # executed whenever a SNMP trap is generated. # Multiple trapemail lines are allowed. # Note: any command that reads standard input can be used. For example: # trapemail /usr/bin/logger # will log trap messages into system log (/var/log/messages). ######################################################################## trapemail /bin/mail -s 'HP Insight Management Agents Trap Alarm' [email protected]
典型的RAID警报电子邮件如下所示:
Trap-ID=3040 Accelerator Board Battery status change, slot number: 1. Battery failed. Status: Failed..
要么
Trap-ID=3034 Logical Drive Status Change: Slot 1, Drive: 2.Status is now Rebuilding.
要么
Trap-ID=3034 Logical Drive Status Change: Slot 1, Drive: 1.Status is now OK.
编辑:
看来您在使用100系列ProLiant,HP Health代理和Debian时遇到困难。 这是一个受支持的解决scheme,但根据您如何安装和configuration解决scheme, 您可能会遇到问题 。 鉴于此,您可能只需安装cciss_vol_status实用程序并通过cron运行定期检查。
snmptt(SNMP陷阱转换器)是一个伟大的小工具。 你可以教它典型的OID和消息,并把它们翻译成一些合理的消息。 看一下,看看它是否有利于您的需求。
编辑:哦,如果你还没有,去为你的设备下载一个SNMP MIB ,并把它放在/usr/share/snmp/mibs目录下。 然后重新启动snmpd和snmptrapd。