sar -u 1 | awk'{print $ 9}' 所以这会每秒给我“CPU空闲”值。 我想在这种情况下,电子邮件的价值连续10次“0”? 什么是适当的方式来做到这一点? 我find了初步的解决scheme sar -u 1 | awk '{ if (int($9)==0) { i=i+1; { print i, $9 } } if (int($9)>=0) { i=0 } if (i>=10) print "sending email" }' 但是在打印“发送邮件”的最后一行,我不能把这个叫做mutt sar -u 1 | awk '{ if (int($9)==0) { i=i+1; { print i, $9 } } […]
我可以使用哪个工具(脚本,nagios插件,无论什么)来监控邮件服务器上发送邮件的速率? 我希望该脚本能够计算每分钟或每十分钟左右的传出邮件数量,并通过电子邮件警告我,如果该速率超过预定义的数字,则会检测到可能的垃圾邮件。
Monit似乎在工作,但是当我去到端口2812的web界面时,我得到: Not Found There is no service by that name monit 5.2.5 – 但是,再次,事情似乎在CLI上确定 –>:/var/log$ sudo monit -t Control file syntax OK –>:/var/log$ sudo monit status The Monit daemon 5.2.5 uptime: 11m System 'system_mydomain.net' status running monitoring status monitored load average [0.00] [0.01] [0.05] cpu 0.0%us 0.0%sy 0.0%wa memory usage 645520 kB [63.4%] swap usage […]
我有PRTG监视我的服务器和networking。 我的一些服务器是基于Windows的,我希望PRTG在停止时自动重新启动服务。 这可以使用WMI服务传感器来完成,但我对此有一个挑战。 它需要我手动select要监视的服务。 这很麻烦,不能缩放。 我想自动发现满足条件的服务。 例如服务的启动types设置为“自动”。 这样,我可以将服务设置为“手动”,以防我想临时覆盖自动重启。 这是可能的吗?
有没有一个免费的工具来列出由某些应用程序修改的所有文件? 我想看到的是,我可以开始“监测”,并启动我的应用程序(MS Word)。 之后,我可以停止“监测”,我的监测应用程序将列出所有由MS Word修改的文件。
我们使用ks-soft的Advanced Hostmonitor软件包来监视我们networking上的大约2000个项目。 我们觉得这很棒,支持它的人是太棒了,产品是快速,稳定和成熟的,但是我觉得随着公司的成长,我们开始在与后台pipe理系统整合方面出现一些摩擦点。 我们想要做的事情之一就是能够通过API向我们使用的任何监控工具添加新的testing。 例如,当服务器订单来自我们的零售界面时,服务器会自动生成,作为自动化构build过程的一部分,我们希望自动将新的testing添加到networking监控系统。 Hostmonitor通过一个称为HM Script的function对此有一些支持,但是我们开始遇到一些快速启动 – 我们不能添加新的运营商/用户 我们无法定义新的“动作configuration文件” – 这是testing好坏时要采取的行动。 但是我们所喜欢的关于hostmonitor的是行动档案。 例如,如果一个Windows IIS框变坏,我们的一个糟糕的testing的动作configuration文件就像这样: 再次检查主机(一次) 再等待30秒,然后再次testing 尝试重新启动远程计算机上的应用程序池(最多两次) 发送电子邮件给ops关于重启失败 尝试在远程计算机上重新启动IIS(最多四次) 页面值classpipe理员(最多5次 – 值class后pipe理员确认提醒) 页面备份任务pipe理员(5次 – closures后pipe理员确认提醒) 我开始环顾其他networking监控工具,我正在寻找: 一个全面的API能够添加/删除/控制testing/testing“动作configuration文件”/运营商(不只是插件,我们需要控制和pipe理界面) 能够具有相当详细的行动/升级configuration文件(并通过API定义这些) 我看过Nagios和Icinga,但是我不能从他们的文档中收集是否可以使用这些特性,或者如果可以的话,实现/定制将涉及多less工作。 任何人都可以提供任何build议,指导或经验?
我想使用Foxboard一个简单的networking监视器为多个路由器(所有的路由器连接到互联网)。 Foxboard是一个带Debianembedded式版本的迷你电脑。 我的想法是使用像这样的多个虚拟networking设备: eth0 192.168.2.10 eth0:1 192.168.3.10 eth0:2 192.168.4.10 我发现了一个很好的Python脚本来ping外部主机(来自Ryan Cox的解决scheme): https : //stackoverflow.com/questions/316866/ping-a-site-in-python 当我ping通www.site-a.com和eth0:1时,是否可以configurationDebian来使用eth0?
我在Debian服务器上安装了软件包cacti和snmpd 。 我能够使用列为Unix的数据模板在Cacti中显示常见graphics(例如内存使用情况,平均负载情况,login用户等)。 现在我想使用SNMP数据源replace这些graphics,因为我看到也有CPU使用,并且因为它不被排除,我将来必须pipe理多个主机。 所以,我在机器上安装了snmpd ,并保持snmpd.conf原样。 在Cacti中,我为127.0.0.1主机创build了三个SNMP模板的新数据源: ucd / net – CPU使用 – 很好 ucd / net – CPU使用情况 – 系统 ucd / net – CPU使用情况 – 用户 然后,我从模板ucd / net – CPU Usage创build了一个新graphics,并在Graph Item Fields部分中select三个数据源。 图现在已启用并正在运行,但是为空 。 没有收集到数据。 在控制台 – >设备下,我的SNMP主机列为启动并运行: System:Linux ip-xx-xx-xxx-xxx 3.2.0-23-virtual #36-Ubuntu SMP Tue Apr 10 22:29:03 UTC 2012 x86_64 Uptime: […]
在阅读站点可靠性工程时 ,我阅读了以下内容: 我不明白如何阅读这个图表。 据我了解,紫色区域代表第50百分位(所有stream量的一半)。 而且,对于第50个百分点,执行HTTP请求(即接收HTTP响应)所花费的时间可以从y = 0 ms到y =〜60 ms? 如果这是正确的,那么: 第99百分位是什么意思? 我怎样才能弄清楚顶部蓝色区域的响应时间,即第99个? 我是否从y = 0 ms或y = 1k ms进行测量?
我只是想了解一下Jabber和IM系统如何处理“在线通知”。 我认为将服务器(或可能是单个应用程序)login到Jabber帐户是一件简单的事情。 这做了一些事情。 您有一个方便的方法来近乎实时地监控您的服务器。 它打开了通过Jabber访问信息命令来检测服务器或应用程序的可能性。 有没有人看到这个实现? 仅供参考:Jabber是Google Talk的协议。