对于已标记为“已损坏”的AWS EBS卷,通过SNS发送警报的最佳方法是什么? 在控制台> EC2中,在实例>状态检查选项卡下,您可以设置CloudWatch警报。 但是,在卷>状态检查选项卡下没有function。 我在“健康事件”中发现了一对夫妇,但他们只是因为“音量丢失”和“性能下降”。 不完全是一个受损的音量。 该卷没有收到很多活动,因此监控任何性能指标可能不是一个好的解决scheme。
目前的设置是:将Kubernetes部署在AWS上的私有托pipe区域内的AWS实例上(只有vpn访问实例,尽pipe存在NAT gatway),Prometheus部署为kubernetes中的有状态集以监视运行状况。 问题是,我怎么设置它,所以我得到了普罗米修斯本身的警报实际上是下降? 我想过尝试使用53号健康检查,但似乎只适用于公共地址。
这个结构大概有30个用户和30个目录: /home/user1/input/ /home/user2/input/ /home/user3/input/ /home/user4/input/ … 检查应该监视目录。 如果目录中最老的文件大于5小时,则检查应返回1(警告)。 该检查不作为超级用户运行。 如何给脚本的权限来检查这些目录,而不是别的? 我们使用OpenSuse 42.1 有一个后续问题,如何解决这个与SaltStack: SaltStack:更改Linux的ACL / home / * /input/
我正在使用Monitis服务来监控我的一些基于Web的资源的正常运行时间。 基本上,它从三个地理位置(美国西部,美国东部和美国中部)调拨我的资源,并在两个或更多的人遇到超过10秒的ping时间长时间时提醒。 星期六,我的三个资源全部位于Azure,同时在所有三个ping位置发生了18分钟的中断: (上述时间在日本时区,相当于10月21日太平洋上午4:10-4:28am) 这些, [green]是两个完全相同的web应用的主机名,一个在美国西部,一个在美国东部,使用stream量pipe理器进行平衡。 Monitis中的错误包括美国东部服务的IP地址,所以当Monitis尝试ping时,主机名似乎已经解决了美国东部的服务。 [purple]是美国中北部的一个Web应用程序,扩展到两个S1实例 [蓝色]是美国东部的虚拟机 我有Monitis正在监测的第四个Azure服务,这是美国西部的一个虚拟机。 与其他人不同,Monitis被configuration为从US-MID,澳大利亚和德国ping一个。 就这一次来说,美国的MID平台同时出现停机,但是澳大利亚和德国的ping没有停机。 我已经在Azure中查看了两个Web应用程序的监视图表,并且在指定的时间段内都没有显示任何停机时间。 在这段时间内都显示请求进出,没有实例重新启动。 [绿色]在这段时间内的活动略有增加,但没有什么不寻常的。 虚拟机表示,自9月份以来一直在上升,在系统事件日志中没有显示任何exception情况。 我的问题: 有什么方法可以找出这里发生的事情吗? 如上所述,Azure表示没有中断活动,但似乎中断很多。 Monitis为什么会在多个Azure地区的多种types的服务中显示一个18分钟的中断? 如果在此期间Azure的networking基础架构发生中断,则Azure状态历史logging中不会有任何迹象。 同样奇怪的是,networking应用程序似乎都在报告中断期间报告接收和服务请求。 标记为[绿色]的服务在美国西部的交通pipe理器中设置了相同的服务,所以当美国东部的服务无法进入时,大概应该将美国西部服务重新定向到美国西部服务,但是似乎这样做并没有没有发生。 你能想到为什么这不起作用吗? 如果Azure认为服务一直健康,那么这将是有意义的,但是如果交通pipe理者不redirect交通,我该如何处理一个地区无法进入的情况呢?
我有一个涉及在Solaris 10上安装s / w的项目,除此之外没有其他的东西。 (Tomcat,没有其他交通莫伊等) 安装过程非常慢(开发人员不耐烦)。 在观察性能表(在等待安装/卸载时),我注意到: 上下文切换运行512以上,PerfMon的阈值设置为32 /秒。 中断向上运行1600 w / PerfMon阈值设置为50 /秒数据包运行64 +,同样w / PerfMon阈值16 /秒。 那么,这些阈值是不现实的(即从单处理器恐龙时代遗留下来的)还是我们的系统真正劳动?
我已经在一些使用python和xmlrpclib的应用程序中编写了指向Zenoss的链接。 事件共享相同的事件类,组件以应用程序的名称开始 – 即“AppName – paramaters” 如果应用程序失败,通常会向zenoss发送多个警报。 是否有可能让Zenoss只发送一个电子邮件用于所有组件以相同的AppName开始的事件,直到它们全部被清除? 谢谢
我知道rrdtool图(使用rrdtool 1.4)networkingstream量和主机重新启动一个秒杀是一个非常正常的事情看到。 在过去,我刚刚运行由作者托pipe的removapike.pl脚本,它剥去了秒杀,我很高兴。 最近几次重新启动removapi.pl发现没有尖峰,但很明显,有尖峰。 所以我的问题是,我怎样才能轻松删除这些尖峰,让我的图表再次使用? 现在它是如此歪曲,这是没有意义的。
摘要:我需要一种方法来监视CIFS挂载点,我不知道如何。 你好, 我有一个虚拟机与2个CPU和1GB内存运行debian 5。 它装载我们的一些用户cifs共享文件夹,大约200个cifs挂载点。 有一个运行Apache的服务器,分析这个cifs寻找特定的文件,称为cv.html和personal_info.txt。 Apache有一些PHP,使它很好。 ;) 在乞讨中,我有一些麻烦,没有时间,所以秘书正在pipe理一个文件,所有的用户名和一个cron读取它来挂载它们。 每天一次重新安装,这是由于某种“断开连接问题”,我不知道如何解决这个问题。 这是我的脚本:(/var/www/fotos/llistat_personal.txt有一个名称列表) #!/bin/sh #############################debug #set -x ############################# #############################vars UMOUNT=/bin/umount MOUNT=/sbin/mount.cifs CHOWN=/bin/chown ############################ ############################functions log (){ /usr/bin/logger -t `basename $0` $1; } desmontar () { $UMOUNT $1 log "Umounted $1" } montar (){ [ -a /var/www/$1 ] && chown -R www-data.www-data /var/www/$1 || mkdir -p /var/www/$1 && […]
我想用Solarwinds监视HP Proliant DL 350 G2,我想添加OID和MIB并监视硬盘,风扇,电源状态? 我使用MIB沃克,但响应MIB信息是指Windows Server 2003而不是惠普服务器本身? 我们可以通过Windowspipe理Web控制台查看信息,我想知道信息来自哪里? 那个应用程序是使用MIBlogging还是iLO芯片?
我们正在运行Windows Server 2008,每个客户端通过Draytek路由器连接到互联网。 每个客户端都安装了OpenDNS,可阻止大多数网站。 OpenDNS阻止对于员工需要继续访问的站点有一些限制。 例如,他们有一个Facebook页面,所以我们不能真正阻止Facebook。 工作人员在Facebook上发送各种消息给其他员工以及在eBay上也存在问题。 我们已经有人对这些信息进行纪律处分,pipe理团队希望能够向工作人员展示日志,看看是否有未来的问题出现。 在就业合同中还增加了在公司networking内对互联网使用进行监控的情况。 理想情况下,我们想logging哪些用户访问了哪些网站。 我知道我可以在OpenDNS中查看日志,但是不会告诉我哪个用户访问了这个站点。 是否有任何价格合理的软件可以在具有漫游configuration文件的Windows 2008 Server上执行此操作? 日志会显示访问的时间,date,用户和网站。 谢谢, 丹尼