监控服务器 Gind.cn

Shell脚本在CPU使用率达到100％时通知

sar -u 1 | awk'{print $ 9}' 所以这会每秒给我“CPU空闲”值。我想在这种情况下，电子邮件的价值连续10次“0”？什么是适当的方式来做到这一点？我find了初步的解决scheme sar -u 1 | awk '{ if (int($9)==0) { i=i+1; { print i, $9 } } if (int($9)>=0) { i=0 } if (i>=10) print "sending email" }' 但是在打印“发送邮件”的最后一行，我不能把这个叫做mutt sar -u 1 | awk '{ if (int($9)==0) { i=i+1; { print i, $9 } } […]

哪个工具可以监视Postfix中发送邮件的数量？

我可以使用哪个工具（脚本，nagios插件，无论什么）来监控邮件服务器上发送邮件的速率？我希望该脚本能够计算每分钟或每十分钟左右的传出邮件数量，并通过电子邮件警告我，如果该速率超过预定义的数字，则会检测到可能的垃圾邮件。

Monit似乎在命令行上工作，但在Web界面中得到404'没有该名称的服务'

Monit似乎在工作，但是当我去到端口2812的web界面时，我得到： Not Found There is no service by that name monit 5.2.5 – 但是，再次，事情似乎在CLI上确定 –>:/var/log$ sudo monit -t Control file syntax OK –>:/var/log$ sudo monit status The Monit daemon 5.2.5 uptime: 11m System 'system_mydomain.net' status running monitoring status monitored load average [0.00] [0.01] [0.05] cpu 0.0%us 0.0%sy 0.0%wa memory usage 645520 kB [63.4%] swap usage […]

使用PRTG自动重启服务

我有PRTG监视我的服务器和networking。我的一些服务器是基于Windows的，我希望PRTG在停止时自动重新启动服务。这可以使用WMI服务传感器来完成，但我对此有一个挑战。它需要我手动select要监视的服务。这很麻烦，不能缩放。我想自动发现满足条件的服务。例如服务的启动types设置为“自动”。这样，我可以将服务设置为“手动”，以防我想临时覆盖自动重启。这是可能的吗？

列出由某些应用程序修改或创build的所有文件

有没有一个免费的工具来列出由某些应用程序修改的所有文件？我想看到的是，我可以开始“监测”，并启动我的应用程序（MS Word）。之后，我可以停止“监测”，我的监测应用程序将列出所有由MS Word修改的文件。

具有APIfunction的networking监控工具

我们使用ks-soft的Advanced Hostmonitor软件包来监视我们networking上的大约2000个项目。我们觉得这很棒，支持它的人是太棒了，产品是快速，稳定和成熟的，但是我觉得随着公司的成长，我们开始在与后台pipe理系统整合方面出现一些摩擦点。我们想要做的事情之一就是能够通过API向我们使用的任何监控工具添加新的testing。例如，当服务器订单来自我们的零售界面时，服务器会自动生成，作为自动化构build过程的一部分，我们希望自动将新的testing添加到networking监控系统。 Hostmonitor通过一个称为HM Script的function对此有一些支持，但是我们开始遇到一些快速启动 – 我们不能添加新的运营商/用户我们无法定义新的“动作configuration文件” – 这是testing好坏时要采取的行动。但是我们所喜欢的关于hostmonitor的是行动档案。例如，如果一个Windows IIS框变坏，我们的一个糟糕的testing的动作configuration文件就像这样：再次检查主机（一次）再等待30秒，然后再次testing 尝试重新启动远程计算机上的应用程序池（最多两次）发送电子邮件给ops关于重启失败尝试在远程计算机上重新启动IIS（最多四次）页面值classpipe理员（最多5次 – 值class后pipe理员确认提醒）页面备份任务pipe理员（5次 – closures后pipe理员确认提醒）我开始环顾其他networking监控工具，我正在寻找：一个全面的API能够添加/删除/控制testing/testing“动作configuration文件”/运营商（不只是插件，我们需要控制和pipe理界面）能够具有相当详细的行动/升级configuration文件（并通过API定义这些）我看过Nagios和Icinga，但是我不能从他们的文档中收集是否可以使用这些特性，或者如果可以的话，实现/定制将涉及多less工作。任何人都可以提供任何build议，指导或经验？

Linux的foxboardnetworking监视器

我想使用Foxboard一个简单的networking监视器为多个路由器（所有的路由器连接到互联网）。 Foxboard是一个带Debianembedded式版本的迷你电脑。我的想法是使用像这样的多个虚拟networking设备： eth0 192.168.2.10 eth0：1 192.168.3.10 eth0：2 192.168.4.10 我发现了一个很好的Python脚本来ping外部主机（来自Ryan Cox的解决scheme）： https ： //stackoverflow.com/questions/316866/ping-a-site-in-python 当我ping通www.site-a.com和eth0：1时，是否可以configurationDebian来使用eth0？

Cacti不适用于SNMP数据源

我在Debian服务器上安装了软件包cacti和snmpd 。我能够使用列为Unix的数据模板在Cacti中显示常见graphics（例如内存使用情况，平均负载情况，login用户等）。现在我想使用SNMP数据源replace这些graphics，因为我看到也有CPU使用，并且因为它不被排除，我将来必须pipe理多个主机。所以，我在机器上安装了snmpd ，并保持snmpd.conf原样。在Cacti中，我为127.0.0.1主机创build了三个SNMP模板的新数据源： ucd / net – CPU使用 – 很好 ucd / net – CPU使用情况 – 系统 ucd / net – CPU使用情况 – 用户然后，我从模板ucd / net – CPU Usage创build了一个新graphics，并在Graph Item Fields部分中select三个数据源。图现在已启用并正在运行，但是为空。没有收集到数据。在控制台 – >设备下，我的SNMP主机列为启动并运行： System:Linux ip-xx-xx-xxx-xxx 3.2.0-23-virtual #36-Ubuntu SMP Tue Apr 10 22:29:03 UTC 2012 x86_64 Uptime: […]

了解Google SRE Book中的图表

在阅读站点可靠性工程时，我阅读了以下内容：我不明白如何阅读这个图表。据我了解，紫色区域代表第50百分位（所有stream量的一半）。而且，对于第50个百分点，执行HTTP请求（即接收HTTP响应）所花费的时间可以从y = 0 ms到y =〜60 ms？如果这是正确的，那么：第99百分位是什么意思？我怎样才能弄清楚顶部蓝色区域的响应时间，即第99个？我是否从y = 0 ms或y = 1k ms进行测量？

服务器/系统监视与Jabber？

我只是想了解一下Jabber和IM系统如何处理“在线通知”。我认为将服务器（或可能是单个应用程序）login到Jabber帐户是一件简单的事情。这做了一些事情。您有一个方便的方法来近乎实时地监控您的服务器。它打开了通过Jabber访问信息命令来检测服务器或应用程序的可能性。有没有人看到这个实现？仅供参考：Jabber是Google Talk的协议。

Intereting Posts

VB6 Windows Server 2008 Standard上的计划任务如何每天在特定的时间运行cron作业？如何限制访问上下文反向代理的tomcat上下文？如何知道创build一个SVN仓库的date？ Firefox间歇性地尝试下载/打开一个PHP页面，而不是在服务器上执行 mscorlib.dll chkdsk错误后需要重新安装.NET（或其他）吗？ balance-rr和802.3ad有什么区别？试图为Postfix OPENSSL debian squeeze生成TLS键如何为现有的守护进程创build日志？ cyrus-imap SSL错误设置只有一个ip可以访问ftp服务禁用apache的日志轮转或移动文件位置计划任务是否显示networking驱动器？在CentOS中安装Fedora RPM 为什么我找不到内核映像？

Articles of 监控

Shell脚本在CP​​U使用率达到100％时通知