我有一个错误的电源button,喜欢重新启动自己的服务器。 通常有警告标志,就像/ var / log中的acpid日志文件在大约10小时左右开始垃圾邮件垃圾一样。
有一个简单的方法,我可以有一些监视acpid日志,并发送电子邮件时,它有新的活动?
我不认为自己是非常先进的,所以你可能有任何“指南”来完成这样的事情将是非常有益的,非常感激。 谢谢!
你可以使用像LogWatch的东西。 或者甚至是这样一个简单的脚本(这是你需要修改你的环境的伪代码):
#!/bin/bash GREP_STRING=`grep -c <error string> <acpid log location>` if [ $GREP_STRING -ne 0 ] then <send email notification> fi
把它放在cron中,每隔一小时左右运行一次,你应该收到一封电子邮件,告诉你它什么时候变得更糟。
您可以使用OSSEC HIDS设置日志文件规则,同时从主机获取安全信息。
设置它非常简单:
/var/ossec/rules/local_rules.xml
如下所示 /var/ossec/bin/ossec-control start
OSSEC local_rules.xml
<group name="local,syslog,"> <rule id="100001" level="13"> <regex>^.*Your string.*$</regex> <description>I've just picked up a fault in the AE35 unit. It's going to go 100% failure in 72 hours</description> </rule> </group>
规则可以非常灵活和复杂。 请参阅此表以了解规则中涉及的参数。
如果您不需要或不需要其他安全function,则可以通过删除rules
标记下的include
行来禁用它们。
我会build议Nagios的,我们运行在哪里我的工作监控多台机器是networking。 它非常好,我没有专门为你做什么,但你可以设置它发送错误时给你发电子邮件。
有一个指导在这里安装它在Ubuntu http://beginlinux.com/blog/2008/11/install-nagios-3-on-ubuntu-810/和一个在这里安装http:://www.debianhelp。 co.uk/nagiosinstall.htm 。
你可以发送这样的东西:
EMAILMSG="/tmp/logreport.$$" echo "Something to put in the email" >> $EMAILMSG cat $EMAILMSG | mail -s "Whatever Subject You Like" [email protected] rm -f $EMAILMGS
在服务器上下载并安装Splunk 。 它类似于logwatch,但为您的日志提供了一个search引擎。
您可以将其configuration为对日志进行索引,然后可以search日志并查找模式,查找错误,然后查看其他日志在特定故障点正在执行的操作。
它也可以设置为发送警报或执行脚本在一定的阈值。 所以如果一个特定的错误开始被垃圾邮件发送到您的日志,您可以编写脚本来自动重新启动违规服务。
我们在我们的服务器集群中使用splunk,它已经是一个救星!
我使用Zabbix和IPMI工具按需重新启动故障服务器。 此外,我认为OSSEC也是一个不错的select,但是你真的需要尝试和debugging之前把它放在产品…
在之前的雇主中,我们使用了logurfer +来实时监控日志并发送电子邮件警报。 调整误报需要花费很多时间和configuration,但是我们有一个规则集,对于各种调查结果和警报都非常有效,远比Nagios出于类似目的更有价值。
不幸的是,我无法再访问configuration文件来提供我们过滤的样本,但该网站应该提供更多信息和示例。
你也可以看看我的Octopussy项目。