刚刚下载了一个Splunk的试用版,并且正在考虑使用它来监控Windows服务器基础以及相关的应用程序,例如: o Windows事件日志/ WMI查询(用于Windows O / S,SQL Server,Exchange等) o Apache / Jboss / Tomcat日志 o Oracle监听器/ db / etc日志 o自产的日志文件 任何短而甜的build议或陷阱?
对于ESX和ESXi,最近我们有两个系统,由于发生故障的磁盘,引导分区变得退化。 我们设法捕获的唯一警报是戴尔服务器上的可视警报。 我们未收到有关故障或降级arrays的任何电子警报。 有没有人有任何监测这些types的失败的经验? 在这两种情况下,服务器都在RAID 5 SCSIconfiguration下运行(一个系统上有5个磁盘,另一个系统上有3个磁盘),如果我们运行的是Windows Server操作系统,则会在Eventviewer中创build一个警报。 我会在哪里开始寻找这个解决scheme。 可以在VCenter或vFoglight中configuration吗?
这可能是服务器故障的边界,所以我很酷,如果这是决定这个问题迁移到其他地方。 作为一个系统pipe理员,我负责响应任何在几小时内发生的监控警报。 我有一个公司的问题黑莓,所以如果发送监测警报,我可以通知。 这很好..只要我不在另一个房间或睡着了。 是的,收到电子邮件时会发出噪音,但如果我错过了持续约2秒的小噪音,我已经错过了警报。 我正在寻找的是一个应用程序(支付是不是一个问题),当收到一个符合某些标准, 不会停止,直到我解雇它的电子邮件时,可以发出警报。 标准将是以下任何一项(如果我可以混合和匹配标准,奖励点数) 发件人地址 信息主题 收件人 这主要是为黑莓手机,但其他智能手机的应用程序可能会有利于更大的社区。
我想弄清楚如何将电子邮件通知应用到系统性能触发器,例如高CPU,高内存使用率,低磁盘空间等。 我尝试了使用Googlesearch,但我无法find一个指导,通过这样做,因为我以前没有这样做。 Windows 2008 R2能够做到这一点,或者是第三方软件吗?
我正在使用Xenserver 6.2并将ssmtp.confconfiguration为mail_alert.conf,以便通过电子邮件接收警报。 我遵循http://support.citrix.com/servlet/KbServlet/download/34969-102-706058/reference.pdf文件中的说明。 我使用Gmail邮件发送电子邮件。 当我尝试: [root@xen /]# ssmtp [email protected] 从命令行并尝试发送电子邮件,没问题。 这是正确的路上。 但是当我设置一些虚拟机来生成警报时,会生成警报。 我在XenCenter中看到,但电子邮件不起作用。 我在/ var / log / maillog文件中看到这个: May 27 16:17:09 xen sSMTP[30880]: Server didn't like our AUTH LOGIN (530 5.7.0 Must issue a STARTTLS command first. 18sm34990758wju.15 – gsmtp) 从命令行,每件事情都很好。 这是上述命令行操作的日志logging: May 27 15:55:58 xen sSMTP[27763]: Creating SSL connection to host May 27 […]
有一个scom的用户可能知道的“ 监视器的规则 ”。 如果您有一个由监视器生成的警报(而不是生成警报的规则),请不要closures它并让它自行closures。 如果确实closures了警报,则不会再次通知该问题,直到显示器恢复到健康状态,然后回到不健康的状态。 如果某人closures磁盘空间警报(或者在维护过程中发生警报,或者它已经老化并且被自动closures),那么在机器出现问题之前,我们不会发现服务器仍然存在空间问题。 我想要一种方式来重新生成处于不健康状态的显示器的警报。 目前我已经看过一个名为GreenMachine的PowerShell解决scheme,但它似乎并没有工作得很好,而且非常慢。 人们发现这个问题有哪些解决scheme?
本周,我的一个复制订阅已过期,因为我没有收到任何警报,说有login错误(我已经修复了这些警报和错误)。 我现在想要的是,如果再次发生这种情况,能够发送一个提醒,说订阅即将到期(即将在1或2天内过期)。 当订阅到期时,我有一个提醒,但这是事实。 我已经通过sys.messages查看任何具有“Expir”的文本,但我还没有find适当的错误代码。 任何人都可以指出我在正确的方向吗? 谢谢。
我们有一个环境,我们目前正在监控~50台运行esxi的VM主机。 我们可以通过vcenter轻松获取硬件事件警报和超出性能阈值。 我们计划在我们的基础架构中添加一些KVM主机。 但是我们不知道如何获得类似的监控和警报function。 有什么build议么? 我看过RHEV,看起来很有希望,但我不确定pipe理层目前是否想要为这两个pipe理程序处理许可。 也许有一些免费的公用事业可以做足够好的工作?
这是一个反复出现的问题,但是我能find的最接近的问题是7年前问的 ,而这个时间几乎是不同的。 我经营一个小型企业,我们主办了多个中小型客户端网站(没有任何需要超过几个1G数字海洋液滴)。 目前的解决scheme(ad-hoc脚本和电子邮件)开始显示其局限性,特别是当前的业务快速增长。 业务问题 因此,我需要build立一个新的解决scheme。 也许不是所有的一次,但我当然不希望重新做一切。 我能想到的要求: 简单。 简单。 简单。 我没有工作人员,我没有时间,我不消化胡说八道。 我准备好分配所需的资源,但不多。 没有SaaS。 在过去的几年中,我一直在使用大量的SaaS,他们最终都变得更加昂贵,停止服务或者购买,然后完全消失。 SaaS是我不想承担的风险。 最终,我只关心简单的事情: 我的网站没有错误,速度不够快? 我的网站是否超载? 我的磁盘是否满了? 有一个基于Ansible的自动部署系统,它应该能够负责为每个站点configuration监视/警报 我希望主pipe人员在凌晨4点以一切可能的方式醒来,当然如果有用的话 所有的事件/问题都应该在某个地方进行跟踪,并且易于移动(如JIRA板) 所有的数据应该存储在某个地方供我以后检查,包括HTTP日志,我希望能够在这些日志中查找缓慢或容易出错的页面。 我有几十个(Debian)服务器,需要集中所有关于它们的信息 我做了研究 为了做到这一点,我开始挖掘互联网,发现基本上可以互相连接的东西,如果你愿意的话。 ELK堆栈 (和“Beats”)。 似乎完美的收集和存储日志/指标。 您可以拥有漂亮的仪表板并查看您的数据,但这只是您所能做的。 X-Pack 。 似乎是与ELK完美的事情,但看起来像一个漂亮的废话蛋糕周围厚厚的糖衣。 另外,不公布价格的“订购”模式可能意味着价格过高。 Shinken / Nagios / Zabbix是最初的竞争者,但却很无聊而且复杂,需要自定义代码和全部的创可贴才能与ELK合作。 Riemann看起来像是一个很好的框架,可以触发警报,但不会在事后进行pipe理。 另外你必须自己写一切。 我不知道该把它插在什么地方(我不想有几个探针测量相同的东西)。 对我来说可能太复杂了。 ElastAlert可能是一个好主意,但似乎没有一个实际的方式来pipe理警报 bosun看起来比ElastAlert更成熟,更完整,但是也有相同的缺点和更复杂的configuration openduty环有趣,但显然太不成熟,被认为是可行的 cabot做出了很好的承诺,被一家公司用来制作和使用,这个公司为了编写文档,所以它可能不会死(虽然有点晕) 当然,还有普罗米修斯 , Graphana , Graylog , Fluentd和其他无数的人。 […]
像许多人一样,我使用Zabbix系统来监视我的服务器。 如果我的一台服务器有问题,Zabbix会发送一条消息到我select的电子邮件地址。 (很多 – 大多数?监测系统是这样工作的。) 当一个警报发生时,我想让我的电话响起来,声音很大。 但我不想让它在收到的每封电子邮件或短信上发出一个响亮的声音。 是否有其他机制可用于将警报可靠地传送到移动设备,这些移动设备可以configuration一个响亮而恼人的提示音?