监控服务器 Gind.cn

用石墨监测 – 耳语不保存指标

我通过本教程成功安装了Graphite： https://www.digitalocean.com/community/tutorials/how-to-install-and-use-graphite-on-an-ubuntu-14-04-server 当我运行： echo "test.count 4 `date +%s`" | nc -q0 127.0.0.1 2003 并运行： whisper-fetch /var/lib/graphite/whisper/test/count.wsp 值4似乎被保存但是当我从另一台计算机运行相同的命令，并将localhost更改为我的IP地址时： echo "test.count 4 `date +%s`" | nc -q0 192.168.88.65 2003 毕竟，这个价值似乎并没有被保存在耳语中。但是当我删除目录时：的/ var / lib中/石墨/耳语/testing 并再次运行前一个命令，所以testing文件夹将被创build，但不保存该值。有谁知道我怎样才能发送指标，从另一台计算机在同一个networking窃窃私语？我知道端口是开放的，因为nmap返回： martin at martin-pc templates >>> nmap 192.168.88.65 Starting Nmap 7.01 ( https://nmap.org ) at 2016-09-01 18:25 CEST Nmap […]

Ec2 c4.large没有响应

我有这个ec2 c4.large机器，我主持一个video播放器，iframeembedded到其他网站的目的。我从awspipe理界面发布aws统计：正如你所看到的，CPU的使用率是10％，磁盘I / O是0％，networking在7 500 000字节左右，networking出口在50000 000字节左右。你认为这个问题来自networking吗？我也发布了htop （ubuntu）命令结果正如你所看到的，RAM的工作负载是800MB左右，大部分是由caching使用（我使用mod-pagespeed-stable_current_amd64.deb包来pipe理apache中的caching）。在这里，我真的很困惑，问题来自于服务器非常慢（我必须等待40秒才能得到响应，但是当stream量很低时，就像1秒一样）。你认为这可能是一个数据库问题？但CPU是从字面上空闲。我也张贴从ubuntu里面的车速表结果：命令是： speedometer -l -r eth0 -t eth0 -m $（（1024 * 1024 * 3/2））速度计显示的networkingOUT统计数据是否远远低于aws的结果？速度表：〜2Mb＆aws：50Mb 我也张贴nmon命令进行磁盘监视（在ubuntu中）正如你所看到的，在读操作过程中它不会超过350kb 所以我看不出有什么可能导致这种延迟问题，还有什么我必须检查？我作为附件添加谷歌分析统计（活跃用户）任何帮助将非常感激，谢谢

哪个开源工具来监测和检测Wi-Fi连接丢弃？

我收到了一些Wi-Fi LANnetworking用户关于互联网连接丢失的报告。我有访问客户端计算机，我想检测Windows WiFi客户端的networking连接下降。我认为一个Windows客户端服务轮询到IP应该是足够的。我发现的东西（nagios，zenoss等）对于这样一个“简单”的任务来说太多了。你推荐哪个工具？

通过盐堆和信标进行服务监测

我试图通过盐堆和灯塔来监视服务。如果发生事件（例如：nginx服务停止在一个小时），需要将它写入盐主文件。我不知道如何调用事件数据并将其传递给write_file.sls 。有人能帮我吗？ root@SALTMASTERLOCAL:/var/log/salt# salt-run reactor.list event: ———- suffix: salt/reactors/manage/list |_ ———- salt/beacon/*/service/: – /srv/salt/monitoring/9spokesBeaconN.sls /srv/salt/monitoring/9spokesBeaconN.sls文件： load_service_monitoring: local.state.apply: – tgt: '*MASTER*' – arg: – monitoring.write_file – kwarg: new_minion: {{ data }} monitoring/write_file.sls文件： {% from "monitoring/9spokesBeaconN.sls" import new_minion %} create /root/beacons_load.confvg file: file.append: – name: /root/beacons_load.confvg – text: {{ new_minion }} 结果/输出： Event fired […]

监视ramdisk吞吐量

我想知道是否有一个工具可用来监视当前的ramdisk吞吐量。我发现，与sysstat ， iostat等我只能够监视当前通过物理设备的吞吐量。我正在寻找的是一个工具，它会产生一个指示当前吞吐量的输出。就像是： DEV write read overall ramdisk-1 1.4 GB/s 0.4 GB/s 1.8 GB/sec 你们有关于如何产生这个指标的build议吗？

服务器随机冻结几秒钟

我注意到一个奇怪的问题，我的Ubuntu（networking）服务器随机冻结，几秒钟，然后再次恢复。服务器具有以下规格; – 2 vCores of 2,4 GHz – 8GB of RAM – 40GB SSD – 100 MBit network 我主要在服务器上运行以下服务; – NGINX (webserver and proxy) – Mysql – Varnish 这个问题并不是每天都会发生的，但是通常情况下（大约每隔20秒）就会发生一次。我正在运行Netdata作为Web监控工具，而Newrelic则用于关键问题。这是从Netdata仪表板获取的CPUgraphics的屏幕截图，因为您可以看到服务器在发生冻结时停止报告统计信息。我发现IO / Wait有时会在看到服务器冻结之前爆发，但在读取线程和search高IO / Wait之后，除了[jbd2/vda1-8]进程不断地写入磁盘。当运行像top, ps, iotop and htop这样的监视工具时，即使发生冻结问题，我也没有看到任何使用过量资源的进程。当使用主机提供商的（OVH's）KVMlogin到服务器时，我看到以下消息; NMI watchdog: BUG: soft lockup CPU#0/1 stuck for 21s! [process] NMI watchdog: […]

AWSstream程监控

对于EC2实例，我该如何监控：（1）特定进程是否停止运行;（2）是否可以通过HTTP访问特定的URL（返回2xx） – 类似于Pingdom和其他类似的工具（1）我特别感兴趣。我检出了AWS CloudWatch，但它似乎只跟踪了一组非常基本的度量标准，如CPU，磁盘或networking利用率。过程监控将非常有用。看起来像你想在一个实例上运行软件时要监视的基本的东西，但它似乎并没有被覆盖。我宁愿不花时间安装和configuration代理和类似的东西。我有一个非常简单的情况，我只想通过电子邮件知道在一个EC2实例上名称为'uwsgi'的进程何时closures:-)

什么是轻量级的方式来监测机架中的服务器的温度和负载

我知道Nagios和Sensu，但是我正在寻找一个简单，轻量级的解决scheme来监视和logging负载和温度数据。感兴趣的指标（按重要性排列）： CPU温度 HDD温度 GPU温度（nvidia） CPU负载花哨的仪表板来显示数据是不需要的。电子邮件警报，如果温度超过一定值，也是需要的。我已经读过，lm-sensors可以和cron作业一起使用来监测温度，并在超过阈值时发送电子邮件。不幸的是，我读过的教程基本上是过时的，或者有一个脚本没有什么解释。监控机架中服务器温度和负载的轻量级方法是什么？

没有连接到HP OVO时，使Nagios堆栈报警

我正在专用笔记本电脑上实施一个小型的Nagios实例来监视一些telcom设备。警报必须通过我们的客户报告工具（如HP OpenView）通过SNMP陷阱发送。这里没什么特别的。但是，子系统是移动的，因此并不总是具有连通性来报告警报。我们依靠3G调制解调器来提供此连接（如果可用）进行报告。在没有与监控工具连接的情况下，是否有任何意义使Nagios“堆栈”报警，以便一旦连接恢复，它就可以传送报警的最后一个状态？我首先想到了一个“中间人”计划，它将成为Nagios和监控工具之间的桥梁，并处理陷阱。它将采取所有来自Nagios的snmp陷阱，并且如果没有可用的连接性，将它们插入然后传递最后的陷阱… 但是我不知道这样的事情是否存在，就我所search到的，我什么都没发现。

是否可以检查Busybox系统上的NTPd状态？

我需要知道当前的date/时间在小型embedded式Linux系统Busybox中是否可靠。我有Busybox ntpd运行，但显然没有程序来查询状态。在更传统的Linux安装中，我会使用ntpdc，ntpq，ntpstat甚至timedatectl，但是这些Busybox / Buildroot系统都不可用。我还可以做些什么？

Intereting Posts

没有Mod_Deflate的压缩 Cisco IOS和Squid透明代理的简单例子禁用login注销的审计在Windows 2008上设置强制configuration文件时，文件关联不会停留 Dell PowerConnect交换机上的Cisco日志logging同步CLI命令等效 iptables：如何redirect端口80只为特定的域虚拟机上的群集我运行Nagios 2.11来监视我的服务器，我应该升级到最新版本 configurationIIS 8.5中的域外服务器的虚拟目录我应该如何pipe理许多客户端访问的基于服务器的目录结构的重构？ IT帮助台 – 远程pipe理用户configuration文件 Saslauthd在港口25工作正常吗？无法在587端口上工作 Ubuntu的启动脚本问题 build立到Amazon VPC的VPN连接 – 路由创buildSAMBA节点信任关系到Windows 2003 PDC服务器

Articles of 监控