Articles of 监控

用石墨监测 – 耳语不保存指标

我通过本教程成功安装了Graphite: https://www.digitalocean.com/community/tutorials/how-to-install-and-use-graphite-on-an-ubuntu-14-04-server 当我运行: echo "test.count 4 `date +%s`" | nc -q0 127.0.0.1 2003 并运行: whisper-fetch /var/lib/graphite/whisper/test/count.wsp 值4似乎被保存 但是当我从另一台计算机运行相同的命令,并将localhost更改为我的IP地址时: echo "test.count 4 `date +%s`" | nc -q0 192.168.88.65 2003 毕竟,这个价值似乎并没有被保存在耳语中。 但是当我删除目录时: 的/ var / lib中/石墨/耳语/testing 并再次运行前一个命令,所以testing文件夹将被创build,但不保存该值。 有谁知道我怎样才能发送指标,从另一台计算机在同一个networking窃窃私语? 我知道端口是开放的,因为nmap返回: martin at martin-pc templates >>> nmap 192.168.88.65 Starting Nmap 7.01 ( https://nmap.org ) at 2016-09-01 18:25 CEST Nmap […]

Ec2 c4.large没有响应

我有这个ec2 c4.large机器,我主持一个video播放器,iframeembedded到其他网站的目的。 我从awspipe理界面发布aws统计: 正如你所看到的,CPU的使用率是10%,磁盘I / O是0%,networking在7 500 000字节左右,networking出口在50000 000字节左右。 你认为这个问题来自networking吗? 我也发布了htop (ubuntu)命令结果 正如你所看到的,RAM的工作负载是800MB左右,大部分是由caching使用(我使用mod-pagespeed-stable_current_amd64.deb包来pipe理apache中的caching)。 在这里,我真的很困惑,问题来自于服务器非常慢(我必须等待40秒才能得到响应,但是当stream量很低时,就像1秒一样)。 你认为这可能是一个数据库问题? 但CPU是从字面上空闲。 我也张贴从ubuntu里面的车速表结果:命令是: speedometer -l -r eth0 -t eth0 -m $((1024 * 1024 * 3/2)) 速度计显示的networkingOUT统计数据是否远远低于aws的结果? 速度表:〜2Mb&aws:50Mb 我也张贴nmon命令进行磁盘监视(在ubuntu中) 正如你所看到的,在读操作过程中它不会超过350kb 所以我看不出有什么可能导致这种延迟问题,还有什么我必须检查? 我作为附件添加谷歌分析统计(活跃用户) 任何帮助将非常感激,谢谢

哪个开源工具来监测和检测Wi-Fi连接丢弃?

我收到了一些Wi-Fi LANnetworking用户关于互联网连接丢失的报告。 我有访问客户端计算机,我想检测Windows WiFi客户端的networking连接下降。 我认为一个Windows客户端服务轮询到IP应该是足够的。 我发现的东西(nagios,zenoss等)对于这样一个“简单”的任务来说太多了。 你推荐哪个工具?

通过盐堆和信标进行服务监测

我试图通过盐堆和灯塔来监视服务。 如果发生事件(例如:nginx服务停止在一个小时),需要将它写入盐主文件。 我不知道如何调用事件数据并将其传递给write_file.sls 。 有人能帮我吗? root@SALTMASTERLOCAL:/var/log/salt# salt-run reactor.list event: ———- suffix: salt/reactors/manage/list |_ ———- salt/beacon/*/service/: – /srv/salt/monitoring/9spokesBeaconN.sls /srv/salt/monitoring/9spokesBeaconN.sls文件: load_service_monitoring: local.state.apply: – tgt: '*MASTER*' – arg: – monitoring.write_file – kwarg: new_minion: {{ data }} monitoring/write_file.sls文件: {% from "monitoring/9spokesBeaconN.sls" import new_minion %} create /root/beacons_load.confvg file: file.append: – name: /root/beacons_load.confvg – text: {{ new_minion }} 结果/输出: Event fired […]

监视ramdisk吞吐量

我想知道是否有一个工具可用来监视当前的ramdisk吞吐量。 我发现,与sysstat , iostat等我只能够监视当前通过物理设备的吞吐量。 我正在寻找的是一个工具,它会产生一个指示当前吞吐量的输出。 就像是: DEV write read overall ramdisk-1 1.4 GB/s 0.4 GB/s 1.8 GB/sec 你们有关于如何产生这个指标的build议吗?

服务器随机冻结几秒钟

我注意到一个奇怪的问题,我的Ubuntu(networking)服务器随机冻结,几秒钟,然后再次恢复。 服务器具有以下规格; – 2 vCores of 2,4 GHz – 8GB of RAM – 40GB SSD – 100 MBit network 我主要在服务器上运行以下服务; – NGINX (webserver and proxy) – Mysql – Varnish 这个问题并不是每天都会发生的,但是通常情况下(大约每隔20秒)就会发生一次。 我正在运行Netdata作为Web监控工具,而Newrelic则用于关键问题。 这是从Netdata仪表板获取的CPUgraphics的屏幕截图,因为您可以看到服务器在发生冻结时停止报告统计信息。 我发现IO / Wait有时会在看到服务器冻结之前爆发,但在读取线程和search高IO / Wait之后,除了[jbd2/vda1-8]进程不断地写入磁盘。 当运行像top, ps, iotop and htop这样的监视工具时,即使发生冻结问题,我也没有看到任何使用过量资源的进程。 当使用主机提供商的(OVH's)KVMlogin到服务器时,我看到以下消息; NMI watchdog: BUG: soft lockup CPU#0/1 stuck for 21s! [process] NMI watchdog: […]

AWSstream程监控

对于EC2实例,我该如何监控:(1)特定进程是否停止运行;(2)是否可以通过HTTP访问特定的URL(返回2xx) – 类似于Pingdom和其他类似的工具 (1)我特别感兴趣。 我检出了AWS CloudWatch,但它似乎只跟踪了一组非常基本的度量标准,如CPU,磁盘或networking利用率。 过程监控将非常有用。 看起来像你想在一个实例上运行软件时要监视的基本的东西,但它似乎并没有被覆盖。 我宁愿不花时间安装和configuration代理和类似的东西。 我有一个非常简单的情况,我只想通过电子邮件知道在一个EC2实例上名称为'uwsgi'的进程何时closures:-)

什么是轻量级的方式来监测机架中的服务器的温度和负载

我知道Nagios和Sensu,但是我正在寻找一个简单,轻量级的解决scheme来监视和logging负载和温度数据。 感兴趣的指标(按重要性排列): CPU温度 HDD温度 GPU温度(nvidia) CPU负载 花哨的仪表板来显示数据是不需要的。 电子邮件警报,如果温度超过一定值,也是需要的。 我已经读过,lm-sensors可以和cron作业一起使用来监测温度,并在超过阈值时发送电子邮件。 不幸的是,我读过的教程基本上是过时的,或者有一个脚本没有什么解释。 监控机架中服务器温度和负载的轻量级方法是什么?

没有连接到HP OVO时,使Nagios堆栈报警

我正在专用笔记本电脑上实施一个小型的Nagios实例来监视一些telcom设备。 警报必须通过我们的客户报告工具(如HP OpenView)通过SNMP陷阱发送。 这里没什么特别的。 但是,子系统是移动的,因此并不总是具有连通性来报告警报。 我们依靠3G调制解调器来提供此连接(如果可用)进行报告。 在没有与监控工具连接的情况下,是否有任何意义使Nagios“堆栈”报警 ,以便一旦连接恢复,它就可以传送报警的最后一个状态? 我首先想到了一个“中间人”计划,它将成为Nagios和监控工具之间的桥梁,并处理陷阱。 它将采取所有来自Nagios的snmp陷阱,并且如果没有可用的连接性,将它们插入然后传递最后的陷阱… 但是我不知道这样的事情是否存在,就我所search到的,我什么都没发现。

是否可以检查Busybox系统上的NTPd状态?

我需要知道当前的date/时间在小型embedded式Linux系统Busybox中是否可靠。 我有Busybox ntpd运行,但显然没有程序来查询状态。 在更传统的Linux安装中,我会使用ntpdc,ntpq,ntpstat甚至timedatectl,但是这些Busybox / Buildroot系统都不可用。 我还可以做些什么?