Articles of 监控

MySQL从属运行状况检查

我正在创build一个像创build数据库configuration的项目,为mysql实例获取一个只读副本数组,并保持一个打开的连接,并保持其静态在该服务,所以当客户端试图连接一个只读副本比它假设返回不那么忙。 我的问题是应该是什么公式呢? 到目前为止,我只有2个variables,对这个variables的任何改进都是值得欢迎的。 远程服务器是否活着? 与Threads_connected有多less个活动连接 复制是否健康

我如何configurationMunin给我所有的云服务器的“全部”视图?

我有十几台负载均衡的云服务器,都是由Munin监控的。 我可以单独跟踪每一个。 但是我想知道是否可以将它们捆绑在一起,以查看整个云集群中CPU集合的使用情况(例如)。 我怎样才能做到这一点? munin.conf文件可以很容易地处理这个子域名,但我不知道如何configuration这个简单的networking节点。 假设我的Web节点被命名为web_node_1 – web_node_10。 我的conf现在看起来像这样: [web_node_1] address 10.1.1.1 use_node_name yes … [web_node_10] address 10.1.1.10 use_node_name yes 非常感谢您的帮助。

自动DNS在主IPclosures时指向备份IP的logging

我有一个网站,通过Host Tracker监视停机时间。 我还设置了备份服务器,以便在任何停机时间将主要网站的Alogging指向备份服务器。 这两个服务器来自2个不同的提供商,所以如果一个人倒下,我可以迅速行动,并指向另一个提供商的Alogging。 问题是如果在周末或午夜发生这种情况。 有没有办法自动做到这一点? 此网站没有任何电子邮件,MXlogging只是Alogging。

如何监视施乐打印机作业?

我试图编写一个系统来监视使用SNMP(Java SNMP4J库)的大约200台networking打印机。 打印机主要是施乐Phasers和Workcentres。 现在,我需要得到: 打印的页数 所使用的打印质量设置(如果可能的话)。 我想我需要使用SNMP陷阱来获取这些信息。 我使用的是Xerox WorkCentre 6015NI,我configuration它将SNMP陷阱发送到我的笔记本电脑,但迄今为止我收到的唯一陷阱是关于启动的陷阱 – 打印页面时我没有收到陷阱。 所以我的问题是: SNMP陷阱是获得所需信息的正确方法吗? 是否有必要订阅特定的陷阱(不知何故),或者打印机应发送所有生成陷阱(当我的计算机在SNMP陷阱接收器列表中)。 是否有适用于所有或大多数打印机的作业监视陷阱的Xerox MIBs / OID? 谢谢。

监视用户/邮箱的Exchange带宽

我们共享5个不同公司之间的交换服务器。 我们的交换服务器每个月都会消耗大量的带宽(高达几乎TB)。 这是异地托pipe,我们的托pipe服务提供商收取带宽使用相当一分钱。 因此,我需要能够监控哪个用户/邮箱占用的带宽最多,以便为每个公司重新计费。 我现在在看ExMon( Exchange监视器 ),它告诉我需要的信息,但这是一个即时测量,据我所知,没有办法将所有这些即时测量结果在一个月内汇总到了解谁在创build所有Exchange带宽的概述。 快速谷歌没有帮助我find任何免费的Exchange带宽报告/监测软件。 Perfmon不帮我,因为我找不到适当的指标。 有谁知道我可以使用什么工具?

如何监视和警报KVMpipe理程序

我们有一个环境,我们目前正在监控~50台运行esxi的VM主机。 我们可以通过vcenter轻松获取硬件事件警报和超出性能阈值。 我们计划在我们的基础架构中添加一些KVM主机。 但是我们不知道如何获得类似的监控和警报function。 有什么build议么? 我看过RHEV,看起来很有希望,但我不确定pipe理层目前是否想要为这两个pipe理程序处理许可。 也许有一些免费的公用事业可以做足够好的工作?

Sensu / Uchiwa – 没有“检查”列出

我已经使用Puppetconfiguration了Sensu和Uchiwa。 我有客户报告,并检查失败时提高事件。 我检查了我的服务器的/etc/sensu/conf.d/checks/文件夹,由Puppet创build,用于ping检查等。例如: { "checks": { "check-ping-controller.local.net": { "subscribers": [ "sensu" ], "standalone": false, "interval": 60, "handlers": [ "default" ], "command": "/usr/lib64/nagios/plugins/check_ping -H 192.168.66.125 -w 100.0,60% -c 200.0,90% " } } } 如果我在Uchiwa的“客户”页面查看服务器(因为它也在运行sensu客户端来监视自己),我看到在那里列出的检查。 然而,在我的实际“检查”页面中什么也没有显示出来 – 很高兴看到数据中心正在运行的是什么! 有谁熟悉这一点,知道我可能会遇到什么问题? 我在Centos 6.5上运行Uchiwa 0.4和Sensu 0.16。 更新:在过去的20分钟里,我在redis中做了一个“flushall”,并对节点进行了一些更改(取消了一个),导致了Sensu服务的更新。 这似乎已经解决了问题,并且检查出现! 我猜这是redis的'flushall'命令,但是我对Redis不熟悉,不知道为什么会有帮助… 任何想法SF?

跟踪抖动和Packetloss的最佳方法是什么?

我需要跟踪MPLS线路上的抖动和数据包丢失。 捕获这些信息的最准确的方法是什么,而不会干扰来回发送的数据? SmokePing是工作的最佳工具,还是有更好的?

最好的免费networking监控工具,用于几个运行(主要是)Java应用程序的服务器?

什么是监控运行(主要是)Java应用程序的一组服务器的最好的免费工具? 它需要监视几个应用服务器(一些JBoss,一些docker等)。 所有服务都是在Ubuntu或Debian下通过YAJSW(Java应用程序的服务包装)从服务系统启动和停止的。 你有什么经验,在那里的工具? 现在,我们正在严重看待这三个: Hyperic公司 OpenNMS的 潘多拉FMS 什么是现实世界的经验,这些的优点/缺点? 有什么我们应该特别避免的?

logging正在使用10-25%CPU的硬件中断(IRQ)

根据Process Explorer,我有一个服务器在硬件中断上使用10-25%的CPU时间。 我将如何去logging/诊断所有这些IRQ调用的原因? 机器是虚拟的,所以我知道物理硬件不是问题(虽然可能是驱动程序等)。 更新:尝试从这篇文章中的信息: http : //msdn.microsoft.com/en-us/library/ms797921.aspx 关于使用tracelog.exe和tracerpt.exe来捕获DPC和ISR事件,但是当我运行跟踪时,即使使用-dpcisr开关,也没有任何信息。 我得到的报告中的磁盘和进程信息,但没有中断…我知道中断正在发生,因为进程资源pipe理器仍然显示他们使用6-15%的CPU