Articles of 监控

loggingSSH /terminal到video?

如果有人通过Putty(SSH)或terminal访问服务器 – 我想logging一切他们可以在屏幕上看到什么,他们已经input到video.. 有什么解决办法,有没有一个软件可以做到这一点?

使用OpenNMS进行磁盘监视

我确信这个问题之前已经被问到了(而且实际上都是在networking上),但是我正在为此挠头。 OpenNMS安装在我的2008R2服务器上,正在捡起我的节点(检测一些有限的服务等)。 理想情况下,我会开始启动它,并监控磁盘空间和阈值等(类似于Kaseya),但我可以在他们的网站和其他论坛上find的引用这个NET-SNMP安装程序和configuration似乎是一个真正缺乏细节解释我需要做什么/是否需要它等等 任何有这个有趣的监测软件的任何经验,请给我们留言! 非常感谢, TC

PerfMon“数据收集器”比 “保存设置”/ html

Perfmon似乎有两种方法来捕获/logging其发现。 一个是使用“数据收集器”,另一个是打开一个上下文菜单和“保存设置为”生成一个HTML文件。 有人能解释什么样的情景激发了两种不同的数据采集方式吗? 我的意思是,我注意到数据收集器可以存储为CSV,二进制,SQL等。这本身使数据收集器非常有用。 但为什么有HTML格式? 我想尽可能熟练地使用这个工具,所以我试图理解它的录音function的微妙之处。

我怎样才能得到2901思科路由器上每个IP的出站stream量?

我需要的是使用X数量的出站stream量来识别内部源地址,以及stream量正在进行的地方(域或IP) 目前,我在我的Fastehternet接口上configuration了一个“ip记帐”,其中stream量的来源是公共ip本身。 我还需要确定数据包的内部地址。 谢谢。

在Ubuntu中监控物理磁盘运行状况

标题真的很自我解释! 如果物理磁盘运行状况降级,如何触发电子邮件? 另外作为一个观点,我怎么能做类似的软件RAID或ZFSarrays的健康?

如何监视运行embedded式Linux和BusyBox的设备上的CPU使用情况?

我最近开始使用embedded式Linux和BusyBox的设备。 这是非常严重的,没有iostat或sar 。 它也没有dpkg或apt套件pipe理。 该系统是一个保密协议下的开发黑盒,操作系统版本信息是: Linux localhost 2.6.34 #1 SMP Fri Sep 14 10:12:23 EDT 2012 armv7l GNU/Linux 我想监视系统资源,尤其是CPU和内存使用情况,并想知道如何做到这一点。 看来,通过BusyBox的唯一命令是顶部 ,我想要其他的select。 我想我可以在我的Windows开发系统上交叉编译sar ,并以某种方式复制它,但是我从来没有这样做过,但是,如果这是我的最佳select,我愿意尝试一下,所以这方面的技巧会不胜感激。 编辑:在读完SAR的Linux实现之后 ,看来我不会简单地交叉编译sar ,而是包含sar和其他相关命令的sysstat套件实用程序。

如何监视跨越Zabbix中多个组件/服务器的应用程序的“系统状态”?

假设我有一个应用程序使用以下设置: 运行Apache的5个Web服务器 2个configuration为故障转移的数据库 在Zabbix(甚至是另一个监控套件中),是否有可能以及如何监控“应用程序状态”,只有满足以下条件时才会发出警报: 如果1个networking服务器停止响应,则发送“信息”警报 如果3个Web服务器停止响应,请发送警告 如果所有的networking服务器停止响应,发送一个关键的 如果一个数据库处于脱机状态,请发出警告 如果两个DB都脱机,则发送一个灾难 我知道这看起来像5个问题,但根本问题是:你如何创build一个从特定的主机抽象的警报? 在我使用的每个监控套件中,受监控的项目/警报都绑定到主机,导致丑陋的解决方法,如“检查数据库以查看过去10分钟内是否检入了所有服务器”,如果没有,您将收到一封警告邮件,内容如下:“主机:database01.company.com – webserver05尚未在10分钟内login”。 电子邮件导致你相信有一个数据库的问题(因为检查是绑在数据库),但问题实际上是与networking服务器。 理想情况下,警报将与“企业应用程序1”之类的抽象事物相关联。 可以这样做吗?

如何启动monit守护进程而不监控所有进程

似乎默认情况下,第一次启动时没有状态文件(我的状态文件在重新启动时被吹走)将启动监视模式下的所有进程。 我想以不受监控的模式启动守护进程,然后使用“monit start”命令分别启动每个进程。 我似乎无法find任何文件monit如何做到这一点。

Zabbix:如何configuration一个触发器,通知我一个错误已经出现了两次?

我需要configuration一个Zabbix检查,检查访问某个互联网页面。 该页面可以返回http status 200 (ok)或500 (internal server error) 。 当500 status error出现两次时,我想得到一个Zabbix通知,这是可能的吗? 编辑#1:@Tero Kilkanen:这是我尝试创build触发器时得到的错误: Incorrect trigger expression. Check expression part starting from "{Mobit engine health check:web.test.rspcode[Check engine,engine health check].count(10,"500 (internal server error)","eq")". 编辑#2:我创build了如下的Web场景: 而单步: 我创build了下一个触发器: 这里是Zabbix服务器的Lastest Data : 但是,我有两个问题: 1. How can I check that the trigger works if it is not displayed in `Latest […]

Nagios基本configuration(用于快速添加新机器)

我最近开始使用Nagios监视大约25台服务器(主要是虚拟的,有一些独立的)。 其中大部分服务器(包括Nagios主机本身)都运行Ubuntu 14.04 LTS,less数运行12.04 LTS。 因此,我认为我可以利用NRPE并做到这一点。 configurationNRPE对我来说已经certificate是相当复杂的。 例如,对于一个简单的check_disk命令,我不得不通过排除其他每个分区/文件系统来手动指定要检查的分区,如下所示: command[check_disk]=/usr/lib/nagios/plugins/check_disk -w 57% -x /dev -x /run -x /run/lock -x /run/shm -x /run/user -x /sys/fs/cgroup 否则,我的警告和关键阈值立即由sysfs,proc或其他分区引起。 然后我看了一下Nagios主机自己执行的基本服务监视器。 这是列在/usr/local/nagios/etc/localhost.cfg,并包含以下(我很抱歉!我不明白为什么它不会正确格式!) define service{ use local-service ; Name of service template to use host_name localhost service_description PING check_command check_ping!100.0,20%!500.0,60% } define service{ use local-service ; Name of service template to use […]