Articles of 监视

如何使nagios不是类的主机,作为一个未处理的问题?

我在工作时间监视桌面。 有些桌面不能每周只翻一两次。 我禁用了这些主机通知,但主动检查仍然失败,“主机closures”仍显示为在nagios / multisite中未处理的问题。 如何让主机不成为问题? 另外,我想主动检查保持“OK”(最后一个状态),而主机closures。 @Posipiet:我们所有的桌面都运行linux(debian或ubuntu),我想确保它们连接到互联网,没有更新正在等待,没有用完磁盘空间和内存等。我们的一些员工技术不够自己pipe理机器。 我想得到警觉,ssh中,并修复它没有用户不知不觉中。 然而,我不想在假期时被垃圾邮件。

监测用电量(安培/千瓦时)

对不起,如果这太靠近“购物”,但经过很多谷歌search,我还没有find任何体面的解决scheme。 我想要做的是监控电源使用情况,特别是在Nagios插头sockets使用的AMP和kWh / day(尽pipe这可能适用于任何监控解决scheme)。 有没有任何解决scheme/产品可以使这些数据以易于获取的方式提供? SNMP将是理想的,但我不反对如果有networking接口/ telnet / SSH /别的东西一点点黑客。 我希望能够单独监视每个sockets,而不是整个带的使用情况。 我正在考虑使用Aurdino和Maplins的一些便宜的电源监视器来“黑客”一起,但是我不知道是否有可用的东西。 我已经看到一些提供这种function的设备,但它们似乎都与服务器机柜集成在一起,或者有一些附加function使得它们非常昂贵。 看到我可能把我自己拼凑成大约100英镑,我想find最多150英镑的东西。 我们会在我们的区议会使用这个,如果我们的权力津贴超过了我们的收费范围,但我有兴趣知道是否有任何其他实际用途,这不涉及服务器? 我正在考虑把我的桌子放在桌子底下,如果我能把它放到桌子上,并且设置起来很简单,只要看看有什么东西在用,什么时候用。

每个IP带宽和协议使用率图表

在过去的一周里,我一直在尝试使用nTop,而且我已经厌倦了重新启动后丢失所有数据。 因此,在寻找替代品的同时,我也遇到了nfsen的多种build议。 nfsen是否允许我绘制随着时间的推移,每个ip,带宽和协议的使用情况? 如果它不是本地支持的,有人有脚本来解释netFlow数据来certificate这一点吗? 只有nTop才能做到这一点? 我search了这个,我发现人们创build自己的脚本来实现我想要做的模糊 提示 。 我有一些脚本知识(Python,Perl),但我宁愿不发明轮子。 有没有人愿意分享?

如何检查rsnapshot备份?

我有大约二十个不同的webapps的服务器。 每4小时运行rsnapshot任务并将其全部备份到备份服务器。 今天偶然发现由于文件系统input/输出失败,最近4天备份失败。 fsck解决了这个问题,但是4个备份日失去了。 有没有办法检查备份是否正常? 现在我使用munin监控系统,如果它确实很重要,虽然它只检查服务器的健康状况(内存,cpu,硬盘等),没有任何软件检查。 我可以集成一个脚本来检查在rsnapshot日志中的FATAL ERROR条目,但是我不确定它是否足够了? 可能是从备份引导环境的系统来检查其完整性。 不幸的是我没有find足够的信息。

如何使用monit来确保只有一个进程实例正在运行

我有ruby守护进程运行。 有一段时间,我们会无意中启动它的第二个实例,这会导致竞争条件。 我可以使用Monit检测是否有多个“my_ruby_daemon”实例在运行? 如果是这样,杀死额外的实例?

如何使Monit“检查过程”有条件?

我有一个像这样的monit脚本: check process sidekiq_1 with pidfile /tmp/pids/sidekiq_1.pid start program = "/bin/bash -l -c 'bundle exec sidekiq start" as uid jim and gid jim with timeout 250 seconds stop program = "/bin/bash -l -c 'bundle exec sidekiq stop" as uid jim and gid jim with timeout 120 seconds if cpu usage > 25% for 18 cycles […]

SQL Server监控包

我正在考虑购买一个SQL Server监控系统。 它应该与2005/2008一起工作。 我们希望监控性能,可用性,备份,作业和各种数据库问题(空间) 什么为你工作?

Perfmon%处理器时间与任务pipe理器的CPU使用率

一般来说,我是使用Perfmon和性能监控的新手(请简单介绍一下) 我知道Perfmon没有任何东西完全像任务pipe理器的CPU使用情况显示,但我想弄清楚如何通过类似的方式通过Perfmon监视用户的CPU使用率,并试图了解测量(或如何转换数字得到相似的理解) 例如,如果在任务pipe理器中,特定的用户一直使用超过5%的CPU,我想联系用户。 我通过示例学习得最好,所以这里正是我想要做的,具体的例子是: 这是针对32位双四核Windows 2003 Web服务器(8个CPU)的,服务器上有许多网站,每个都在自己的应用程序池/工作进程ID内运行。 通过这里的其他研究,我了解到我做了一个registry更改,以便使用w3wp过程显示PID,以便稍后通过交叉引用可以轻松识别该站点。 我使用以下设置设置了一个计数器: Process -> % Processor Time -> all instances 这是一个例子。 假设我对下图中的“ 黑线 ”用户感兴趣,因为与其他所有用户相比,他的stream程非常高: (我没有被允许发布的图像,因为我是这个网站的新用户..我已经上传的图像:) http://i35.tinypic.com/106yn8k.jpg 所以…以此为例,我看到它们的平均处理器时间是23.264 ,并且已经达到了103.124 那么23.264这个数字对我来说意味着什么呢? 是否与此用户的任务pipe理器CPU读数的平均值相似? 或者,由于这个服务器有8个CPU,我应该把这个数字除以8吗? (23.264 / 8 =平均CPU负载2.9%) 提前致谢。

基于Windows的机器进行类似NRPE的检查

我很抱歉不能提出一个更具描述性的问题标题。 为了获得远程指标,我在基于Linux的机器上使用nrpe,在基于Windows的机器上使用nsclient ++ 。 例如,如果我需要检查某个服务器是否可以从另一个服务器访问,那么我只需使用nrpe运行一个合适的插件(如check_http)。 我最近面临需要做同样的事情,但远程服务器正在运行Windows,所以我坚持使用nsclient ++。 现在,您可以从nsclient ++运行脚本,因此您可以编写一个vb / powershell脚本,这样做。 然而,在我这样做之前,我想知道是否有任何现有的解决scheme(当然,我不是地球上唯一必须面对这个问题的人)。 至less我想有一些东西,比如check_http,我可以使用nsclient ++来运行。

Windows Serverlogin提醒工具

我担心我们的一台服务器因为几个原因而被滥用。 有没有一种工具可以在用户login到服务器时发送电子邮件? 我希望收到尽可能多的信息在后台发送给我的电子邮件。 谢谢