Articles of 监视

哪个进程正在吃我的硬盘?

今天,我用sshlogin后,在FreeBSD服务器上看到很多滞后。 有东西吃了我的两个硬盘(RAID1与gmirror)的100%。 systat -vmstat 5 users Load 0,06 0,16 0,27 17 май 14:22 Mem:KB REAL VIRTUAL VN PAGER SWAP PAGER Tot Share Tot Share Free in out in out Act 460540 7948 801208 12784 194524 count All 629936 9364 2957060 16072 pages Proc: Interrupts rpdsw Csw Trp Sys Int Sof Flt 291 cow 25887 total […]

Zabbix日志监控 – 重复警报

我configurationZabbix来监视我的Jboss服务器日志的Erros,并排除一些知道的错误。 这个设置正在工作,Zabbix会在日志文件中有一个新的“ERROR”条目时向我发送警报,但有一个问题, 有时我得到同一事件的多个警报。 例如,我得到了5个警报,其中有相同的时间戳“2012-06-25 07:55:56,864错误”。 重复的警报计数是不恒定的,有时我得到2,有时5或11。 我检查了GUI中的Monitoring> Latest data,发现没有重复的条目。 我的日志监控configuration如下。 我正在使用最新版本的zabbix服务器(2.0) 项目configuration: 说明:服务器错误监视。 密钥: log["/SERVER/jboss/jboss-5/server/ps/log/server.log","ERROR",UTF-8,200,skip] types:Zabbix Agent(Active) 信息types:日志 间隔:30 触发器configuration: 说明:在服务器日志中发现错误。 expression式: (({SERVER Error Monitoring – PS:log["/SERVER/jboss/jboss-5/server/ps/log/server.log","ERROR",UTF-8,200,skip].regexp("can not execute")})=0) & (({SERVER Error Monitoring – PS:log["/SERVER/jboss/jboss-5/server/ps/log/server.log","ERROR",UTF-8,200,skip].regexp("Unexpected redirect")})=0) 事件生成:正常+多个TRUE事件 操作configuration: 名称:警报邮件 事件来源:触发器 启用升级:取消选中 默认主题/消息:默认 恢复消息:取消选中 操作条件:触发值= PROBLEM 操作操作:发送消息给用户“pipe理员”

Zabbix和来自老式设备的时间序列数据

我们应该监视和logging〜1000个设备(每个设备1..4个传感器)。 短信和电子邮件警报和常见的function是必需的,如果有什么问题。 我认为我们不是在.NET / C#中开发整个生态系统,而是使用现有的生态系统 – 例如Zabbix 。 但是有没有更大的黑客可能? 我认为主要的问题是设备老旧,使用RS232进行通信。 任何想法或任何其他灵活的监测软件?

非发行版Hadoop的监控工具

我通过手动安装大部分软件包(使用二进制文件或源代码)构build了一个Hadoop集群。 我select不使用像Cloudera,MapR或Hortonworks这样的自定义分发版本,因为我想要select使用哪些软件包和版本的灵活性。 然而,这些发行版大部分都有优秀的pipe理和监控工具,这将使我们的开发人员的生活变得更简单。 那里有没有免费发布的工具吗? 我不在乎他们是否是免费或许可的,只是他们会使用定制的集群。 谢谢。

启用:带性能监视器的Asp.net连接池监视

我是一名C#开发人员,但是我正在运行一个系统pipe理问题。 简介 : 我怀疑ASP.NET应用程序在连接池中存在一些问题,并且池不时地泛滥。 所以要确定,我想监视连接池。 经过一番search,我发现这篇文章: 确保适当的SQL Server连接池 。 基本上它解释了关于连接池的东西,以及如何使用性能监视器监视应用程序池。 问题是 : 所以我login到了托pipe网站的ASP.NET服务器(SQL数据库托pipe在不同的服务器上)。 我开始性能监视器,但是当我想select“当前#池和非池连接”,我没有实例select。 所以我不能添加它。 题 我如何创build/提供一个实例,以便我可以监视连接池?

使用plink监控memcached

我需要一个telnet客户端,可以从一个文件或标准input命令,所以我可以做一些快速和脏的自动监控memcached。 我认为plink会对此有所帮助,但它似乎正在做一些超出我需要的事情: 如果我telnet到本地主机11211和写stats ,我得到了memcached的统计信息,如下所示: $ telnet localhost 11211 Trying 127.0.0.1… Connected to localhost. Escape character is '^]'. stats STAT pid 25099 STAT uptime 91182 STAT time 1349191864 STAT version 1.4.5 STAT pointer_size 64 STAT rusage_user 3.570000 STAT rusage_system 2.740000 STAT curr_connections 5 STAT total_connections 23 STAT connection_structures 11 STAT cmd_get 0 STAT cmd_set 0 STAT […]

nagios添加额外的链接服务作为元信息用户可以点击

我正在使用Nagios来监视一些服务,并希望在Web界面上提供一个外部链接,这样当一个服务closures时,操作员可以点击它并被redirect到提供事件订单的其他服务器。 我已经尝试了与'notes_url'关键字没有太大的成功,redirect是完成在相同的域比托pipenagios,即使使用绝对的url,如文件所示。 还有action_url,甚至没有显示! 我记得在某个地方看到一个图标用户可以点击它可以创build; 但我无法find如何做到这一点。 感谢您的帮助!

内核日志logging已禁用?

uname -a Linux host 2.6.32-279.9.1.el6.i686 #1 SMP Tue Sep 25 20:26:47 UTC 2012 i686 i686 i386 GNU/Linux 和创业: ls /etc/init.d/ abrt-ccpp certmonger dovecot irqbalance matahari-broker mdmonitor nfs proftpd rpcbind single ypbind abrtd cgconfig functions kdump matahari-host messagebus nfslock psacct rpcgssd smartd abrt-oops cgred haldaemon killall matahari-network mysqld ntpd qpidd rpcidmapd sshd acpid cpuspeed halt ktune […]

与pingdom高响应时间

我有一台服务器托pipe在我的最后,我用pingdom监视服务器,还有我的路由器。 奇怪的是对路由器的响应时间很好,但是当stream量stream向服务器时,响应时间变得相对较高。 这是超过1000毫秒。 任何人都可以帮助我吗?

Monit权限testing的比较

我试图用Monit来检查特定目录的权限,但我只关心它对所有用户都是可读的。 我不在乎任何其他权限(写,执行)的所有者,组或所有。 我也不在乎任何特殊的权限。 知道我不能改变这个目录的权限,并且有可能另一个pipe理员改变这些权限而不影响依赖这个目录的进程(也就是,授予或撤销对这个组的写入权限),是否可以检查在Monit中获得最低权限? 我有这个正在工作: check directory archive path /var/home/archive/ if failed perm 0755 then alert 但我想有这样的事情: check directory archive path /var/home/archive/ if failed perm > 444 then alert 这对我来说是失败的。 在Monit的权限检查中可以使用比较运算符吗? 如果没有,是否有任何解决方法?