Articles of 监控

可扩展到1000个主机和100,000个variables的监控系统

假设我想监视1000台主机。 对于每个主机,有100个或更多的variables我想要监测:ping,磁盘IO /延迟,RAM释放/交换/等,等等。 每5-10分钟100,000个数据点,保存5年。 什么系统规模这么大? 如果我有10倍的主机数量呢? 那么你会select什么?

在多台机器上处理很多(4+)监视器的最佳工具是什么?

我们是一家贸易商店,所以我们有两台(或更多台机器)的用户,每台机器至less连接两台显示器。 交易者要求我们只有一个鼠标和一个键盘,整个安装。 目前我们所拥有的工具在最好的情况下是可以的,而且我想知道是否还有其他的东西可以解决这个问题。

在Ubuntu中监视CPU使用情况

如何找出在Ubuntu中使用CPU到什么程度的过程? 我想有实时的数据以及logging的历史。 控制台和GUI应用程序都会很棒。 现在的情况是,我的系统似乎真的超负荷,我不知道为什么。 我花了一些时间杀死进程,并观察性能是否提高。 我怀疑在Mozilla中运行的JS脚本是造成问题的原因。 总而言之,看一下CPU使用情况的好工具会派上用场。

如果somone试图侵入Linux服务器,我该如何得到通知?

如果我们的Linux服务器遭到任​​何黑客攻击或服务攻击,我希望通过电子邮件得到通知。 是否有一种可以监控可疑活动的一体化解决scheme,并将所述活动的报告发送到一个电子邮件地址?

监控HP ProLiant DL380 G7,不会出现膨胀

我从eBay买了一台翻新的HP Proliant DL380 G7 。 我运行CentOS ,我想知道一个驱动器何时失败。 一位朋友告诉我,由于我没有在服务器上安装惠普软件,前面的灯可能不会亮起来 – 我必须通过一些实用程序找出驱动器状态。 我已经看到惠普的公用事业在线,但它们看起来非常庞大笨重,甚至是侵入性的。 我只想知道我的驱动器状态。 我不想注册一个惠普帐户。 我不想每周都收到惠普的电子邮件。 我不想安装千兆字节的软件来查看我的硬盘是否在运行。 这是可能的,还是我在惠普的摆布?

间歇性的munin-cron错误“这里没有什么可做的,因为没有任何插件的节点”

我们在我们的一台服务器上安装了munin监控。 一般来说,它似乎运作良好,但有时,在2个月内4次确切,munin-cron产生了以下错误: [致命]这里没有什么可做的,因为没有任何插件的节点。 请参阅http://munin-monitoring.org/wiki/FAQ_no_graphs在/ usr / share / munin / munin-html第38行 在寻找这个错误时,我只能find一些问题,在这个问题上,慕尼黑根本就不工作,而不是我们面临的间歇性问题。 一些有助于防止这个错误或如何debugging,将不胜感激。 我们正在运行CentOS 5.5,使用yum安装了Munin 1.4.5。

有没有支持任何IP摄像机的开源video摄像机安全和监控解决scheme?

有没有支持任何IP摄像机的开源video摄像机安全和监控解决scheme? Zoneminder就是其中之一,但我不确定它是否支持任何品牌的IP摄像机或者有任何品牌限制。

寻找软件来监控预定的电子邮件,并通知他们没有到达或包含错误

与其他许多我认为的一样,我们从运行自动化任务的系统(备份等)获取大量电子邮件。 这些电子邮件应按特定时间表到达,不包含错误消息。 如果他们没有按计划到达或者包含错误信息,那么显然我们有一些工作要做。 问题是,随着电子邮件的进入量,可能很容易没有意识到一个预期的电子邮件没有到达。 当大多数消息不会有错误时,查看大量电子邮件以查看错误消息也是很乏味的。 因此,如果系统能够configuration为监控邮箱,并通知我们预期的电子邮件没有按时到达或在电子邮件中出现错误消息,那将会很不错。 有没有人知道这样的电子邮件监控程序?

Spiceworks与请求跟踪器?

我们目前利用Request Tracker获取帮助台票务,我们利用Spiceworks进行资产盘点。 我正在考虑是否值得从RT转到Spiceworks以获得帮助。 有没有人使用这两个系统,并可以提供一些洞察任何系统的好处/问题? 或者有一个总的哲学原因,为什么一个人应该使用一个解决scheme而不是另一个? 当然,RT是开源的,Spiceworks不是 – 通常这对我来说是一个重要的项目,但是由于Spiceworks是免费的,并且积极地承担社区参与,所以它不是我个人关注的重点。

如何阻止来自特定用户代理的Nginx访问日志语句

我正在closures来自http用户代理的特定请求的日志logging在Nginx的访问日志文件。 基本上来自亚马逊ELB健康检查和我们的外部(Pingdom)监测。 由于这些来自每隔几秒钟,使testing难以sorting通过日志。 "GET / HTTP/1.1" 200 727 "-" "ELB-HealthChecker/1.0" "GET /login HTTP/1.1" 200 7492 "-" "Pingdom.com_bot_version_1.4_(http://www.pingdom.com/)" 我能够阻止图像文件的日志logging,但没有看到任何传入的请求: location ~* ^.+.(jpg|jpeg|gif|css|png|js|ico|xml|svg)$ { access_log off; expires 30d; } 提前致谢! 所以我尝试了@Gnarfoz的build议,但是有一些有趣的副作用。 虽然这两个“健康检查”没有logging,Pingdom开始认识到服务器即使在启动和运行。 这很有趣,因为Load Balancer没有这样做,如果有的话,它会丢弃我们正在testing的节点。 我把MAP部分放在我的日志下面的HTML块中: access_log /www/access.log; error_log /www/error.log; map $http_user_agent $ignore_ua { default 0; "~Pingdom.*" 1; "ELB-HealthChecker/1.0" 1; } 我把IF语句放在我的服务器块中,默认位置是: location / { try_files $uri $uri/ […]