驱动器故障未在基于RHEL的ProLiant服务器上的HP IML中logging

今天,我有两台独立的HP ProLiant服务器上的磁盘进入预测性故障。 其中一台服务器运行Windows Server 2008 R2,一台运行Oracle Enterprise Linux 5(一台基于RHEL5的发行版)。

如果查看这些服务器的集成pipe理日志,Windows服务器会有一个“Caution”条目来声明预测性故障,但是OEL服务器不一样。

我们有一些围绕IML(票证整合,报告等)的现有业务stream程,因此有这些消息的优先select。 所有正确的钟声和口哨响起的Windows盒,但没有从OEL服务器。

我已经回顾了我的监控系统的警报历史logging,并且显示这一直是这种情况–Windows服务器报告它的磁盘故障(预测和实际),而OEL服务器不报告。

SNMP陷阱警报似乎正在工作; 这些都logging在root的邮件文件中,并被捕获在/var/log/messages文件中。 有趣的是,OEL服务器上的IML 似乎显示出修复了先前磁盘故障的条目。 这只是日志中缺less的最初的“注意”或“失败”条目。

Windows服务器具有作为操作系统的Intelligent Provisioning / Smart Start安装的一部分安装的所有HP Management Agent。 OEL服务器启用了RHEL5 HP yum repo,并安装了hpsmhhpilohp-healthhp-snmp-agents软件包。

Windows服务器是DL380p Gen8,而OEL服务器是DL380 G7。 我没有其他运行OEL的服务器代用来进行比较(尽pipe它似乎是我运行OEL的三台DL380 G7服务器所共有的)。 进一步检查显示其他Windows服务器上的IMLlogging驱动器错误,至less早在G5(所以我不认为这是一代问题)。

我也看过/opt/hp/hp-snmp-agents/storage/etc/cma*中的启动/configuration脚本,但是看不到与IML有关的任何东西(不是我真的知道我在找什么这里)。

它是一个缺less的包或configuration语句(即容易解决的东西),是防止这些消息到达IML?

或者这是一个已知的问题(让我别无select,只能在业务stream程中进行其他操作)?

我不认为你应该单独依靠HP IML日志。 并非所有的东西都在那里报告,日志可以被清除。 我不认为它是系统健康状况的权威来源。 加上项目被标记为修复,取决于事件。

如果您需要比较繁忙的EL5系统的IML日志应该是什么样子, 请参阅此pastebin 。 但是我的大部分IML日志已经被清除了。例如:

 # hplog -v ID Severity Initial Time Update Time Count ------------------------------------------------------------- 0000 Information 03:14 02/26/2014 03:14 02/26/2014 0001 LOG: Maintenance note: IML cleared through hpasmcli 0001 Repaired 20:09 05/07/2014 02:38 09/08/2014 0005 LOG: Network Adapter Link Down (Slot 0, Port 1) 0002 Information 05:29 06/30/2014 05:29 06/30/2014 0001 LOG: Firmware flashed (iLO 4 1.51) 0003 Information 03:07 08/12/2014 03:07 08/12/2014 0001 LOG: Firmware flashed (iLO 4 2.00) 

Linux中的HPpipe理代理可以轻松设置为发送SNMP陷阱和电子邮件。

/etc/snmp/snmpd.conf中的典型configuration:

 # Following entries were added by HP Insight Management Agents at # Wed Feb 26 03:12:45 PST 2014 dlmod cmaX /usr/lib64/libcmaX64.so rwcommunity bigbanana rocommunity bigbanana syscontact Systems <[email protected]> syslocation Anaheim, CA 

对于/opt/hp/hp-snmp-agents/cma.conf

 ######################################################################## # trapemail is used for configuring email command(s) which will be # executed whenever a SNMP trap is generated. # Multiple trapemail lines are allowed. # Note: any command that reads standard input can be used. For example: # trapemail /usr/bin/logger # will log trap messages into system log (/var/log/messages). ######################################################################## trapemail /bin/mail -s 'HP Insight Management Agents Trap Alarm - Big Banana' [email protected] 

惠普Linuxpipe理代理应该很简单。 你会想要下面的包:

hp-snmp-agents,hpssa,hp-health,hp-smh-templates,hpsmh,hpssacli,hponcfg