Articles of 监控

Icinga – 在分布式环境中非常高的检查延迟

我有一个分布式的Icinga设置如下: 中央 只接收被动检查结果 分布式 227个主机 835服务 分布式B 67个主机 243服务 CENTRAL服务器始终处于低于1秒的平均检查延迟时间。 DISTRIBUTED B目前处于大约10秒的平均检查延迟时间,但即使这样,我们增加了更多检查。 DISTRIBUTED A有一些严重的检查延迟问题(有时高达700秒,不是刚刚重新加载,而是build立备份),我似乎无法确定。 这里有一个当前的结冰输出: Icinga Stats 1.10.3 Copyright (c) 2009 Nagios Core Development Team and Community Contributors Copyright (c) 1999-2009 Ethan Galstad Last Modified: 02-11-2014 License: GPL CURRENT STATUS DATA —————————————————— Status File: /var/lib/icinga/status.dat Status File Age: 0d 0h 0m 3s Status File Version: […]

Nagios(返回码141是超出边界)随机服务

我们已经在我们的服务器上运行了一段时间的Nagios,但是最近我们得到了(返回码141超出了范围)。 服务器上的负载上升,因为我们与我们的服务上线,但它仍然不是很高(平均负载最高0.7)。 在启动之前,Nagios中的所有工作都正常。 看到图像,当前负载返回代码141. 2分钟前,Beancounters VZ已经返回141.这种情况不规则。 只有HTTP&PING不返回141,它们不会在nrpe上中继。 http://pic-hoster.net/view/45030/ScreenShot2012-05-28at5.31.35PM.png 我注意到,如果我从我的Nagios主机对有问题的客户端执行命令,有时返回会丢失: root@xxx23:/usr/local/nagios/libexec# ./check_nrpe -H 123.123.123.123 -c check_apt APT OK: 0 packages available for upgrade (0 critical updates). root@xxx23:/usr/local/nagios/libexec# ./check_nrpe -H 123.123.123.123 -c check_apt root@xxx23:/usr/local/nagios/libexec# ./check_nrpe -H 123.123.123.123 -c check_apt APT OK: 0 packages available for upgrade (0 critical updates). 这不会发生,如果我直接在客户端上执行它。 我做了什么: 我增加了这个容器的OpenVZ内存和CPUUnit。 我更新到最新的Nagios 3.4.1(来自源代码) 我通过nrpe执行了Nagios的locals检查 – 从来没有得到141回或什么 […]

监视服务器上的某人

我不幸地不得不给予我不完全信任的人有权访问Web服务器来完成他们从未完成的工作。 他们将远程访问服务器(即我将无法看到他们的屏幕)。 可以做些什么:a)主动限制任何潜在的损害,b)事后准确地logging他们在服务器上做的任何分析,即使事情看起来不错。 他们将更新Web应用程序。 提前致谢! —更多信息:服务器是一个Ubuntu的AWS服务器。

哪些监控项目要显示给pipe理层?

我的pipe理层要求监视屏幕显示在走廊内。 他们想到销售人员在试图销售这款从未出现故障(从不承诺)的奇妙设备时所展示的精美屏幕截图。 或者我们在访问Nagio或Cacti网站时看到的那种东西(我展示了一些,他们说是的)。 我的pipe理层几乎不知道计算人员在做什么。 他们希望这对networking,服务器等有一些专业的感受,可能被视为专业。 我们有 : 3台服务器(1台文件服务器,2台应用服务器) 1个备份服务器 1个局域网和3个网pipe交换机 2条ADSL线路 1个VPN连接7个小型远程站点 1个Oracle数据库 2个应用程序在服务器上运行 还有很多小东西 我们已经使用Nagios。 他们对我们的简单观点不感兴趣,说一切都好。 我想有一些更好的想法给他们,所以他们可以告诉我他们想要这个或那个。 我想想 : 显示磁盘使用情况的饼图(带部门名称) 显示文件服务器上的磁盘I / O 一张图显示交换机上的networking吞吐量 显示Oracle吞吐量的图表或其他相关信息 VPN的天气图 任何更好的想法?

监视BGP连接

你知道任何监测BGP对等体,前缀,logging失败,前缀数量等特殊软件吗? (思科) (不是zabbix,nagios等,我知道你可以编写插件或使用snmp,但我正在寻找已经编写的软件) 谢谢!

K-12学生笔记本电脑的互联网使用情况

为了帮助家长保护孩子,我正在开发一些关于互联网安全的课程。 在帮助家长控制家用电脑这个问题上,我很好,但是我并不是很了解教育机构如何configuration他们提供给学生的笔记本电脑(我认为)父母对configuration的控制能力会减弱,上网。 显然,家长可以在家中设置一般的使用规则,使他们可以在使用学校提供的笔记本电脑时看着自己的孩子,但是当孩子不在家时呢? 我有一些具体的问题是: K-12学校通常如何configuration学生笔记本电脑上网? 学生通常被允许连接到任何给定的WIFI,或者他们可能会限制到学生的家庭networking? 学校networking之外的学校是否logging/监控互联网使用情况? 通过基于客户端的监控软件包或其他? K-12学校的典型互联网使用政策是什么? 编辑: 感谢迄今的信息! 我真的在寻找一些信息,让学生可以把笔记本电脑带回家,或者通过学校课程购买他们在课堂上使用的地方。 任何人都支持这种可以点亮的东西吗?

使用Nagios监控ESXi主机

有没有人推荐使用Nagios监控ESXi 4.1主机的方法? 我已经看了SNMP,但似乎是在一个非常抱歉的状态。 Net-SNMP似乎没有被包含,并且有一个我build立的SNMP守护进程。 但是从标准的MIB中,似乎只有networking接口计数器,VMWare MIB看起来毫无用处。 现在我正在考虑SNMP的接口速度,并尝试在http://unimpressed.org/post/96949609/monitoring-esxi-performance-through-nagios列出的插件。 任何人有更好的主意? 我想直接监视主机,而不是像vCenter一样。

监视星号服务器上SIP终止的方法

我有一个nagios设置,确保SIP在我的Asterisk服务器上响应,这很简单。 我的问题是,有什么样的可能性,Asterisk服务器可以实际终止提供商正确终止? 在产生一个testing电话,并确保在另一端的东西拿起? 我意识到这是一个多部分和非常困难的问题。 没有昂贵的设备,几乎不可能知道终点的另一端是什么介质。 只是好奇你的SIP / Asterisk家伙正在做什么来监测这个知道什么时候除了你的用户打电话告诉你是这样的情况?

在Unix中sorting活动进程

我怎样才能sorting在UNIX上的总进程时间的活动进程?

最好的开源服务器通知软件

我正在寻找一个开源的通知/监控软件,这将很像咆哮与Mac的工作。 这将是真棒,如果我可以从我的服务器收到某些消息到我的Mac电脑时,让我们说它重新启动或一些预定义的错误发生等。 任何人都知道这样的事情? 我知道Nagios,但我并不想那么复杂。