Articles of 监控

有没有办法通过Collectd来收集WMI或WBEM / CIM数据?

我有一个运行statsd,collectd和Graphite的Ubuntu服务器。 我期待通过WMI从Windows服务器收集数据。 我没有在Collectd的网站上看到WMI或WBEM / CIM的官方插件。 是否有第三方插件可用,或者某种翻译层可以放置到位?

跟踪共享主机上个人网站的资源使用情况

我有ISPconfig的Centos 6 Web服务器(Apache-itk,PHP,MySQL)。 我在这个networking服务器上有大约100个网站,他们都属于我。 我必须能够跟踪每个站点消耗多less资源(stream量,CPU,RAM),并且可能会限制某些站点的资源,或者优先考虑其他站点。 没有使用虚拟化,最好的方法是什么? 共享networking主机如何pipe理资源? 编辑: stream量 :ISPconfig显示stream量使用情况(网站 – >网站stream量)。 对我而言足够了。 由Apache的CPU和RAM :因为每个Apache虚拟主机运行在不同的用户(MPM-itk),我只需要知道每个用户消耗资源超时。 (我已经试过,但还没有得到如何使用它) CPU和RAM的MySQL :这是最难的部分! 所有的mysql实例都在mysql用户下运行。 如何跟踪每个mysql用户的mysql资源使用情况? CloudLinux和BetterLinux似乎很有趣,有没有其他的select呢?

创buildMMS警报以监控主要可用性

在MMS中有没有一种方法来定义一个警报来监视群集中的任何服务器都无法升级到主服务器的情况? 我试着定义了以下警报:'如果主types的主机closures,警告',但是当我手动closures群集中的服务器时(为了模拟一个非常糟糕的群集),警报不会被触发。 有什么build议么?

使用pidstat或sar报告每个进程的IO统计信息

我试图跟踪一些“可疑”进程随着时间的推移使用。 理想情况下,要通过munin使这些统计数据可用,或直接推入石墨。 但是,作为一个起点,能够以合理的空间/资源高效的方式跟踪这种使用情况,这将是非常好的。 然后能够在一段时间内检索前10名IO消费者及其数据读/写统计信息。 pidstat -d 2似乎每隔几秒钟就产生一次最高IO消耗过程的输出。 而且我知道sar有一些内置的归档,但我不知道如何将它归档到pidstat (也许在SA1_OPTIONS ?我在debian / ubuntu上)。 除了pipe道pidstat到磁盘,然后在输出上运行一些收集/聚合,有没有办法与sar做同样的事情(但更有效),然后检索统计信息?

收集“接口”插件报告累计值而不是速率

Collectd的接口插件应该每秒钟报告八位字节和每秒的数据包,这里logging: https ://collectd.org/wiki/index.php/Plugin:Interface,但对我来说,它报告累计的八位字节和数据包(如ifconfig一样)。 我知道collectd实际上并不是像这样度量度量,而是从系统实用程序中收集它们,所以我认为这不是一个collectd错误。 (但也许是!)我已经能够find很多人设置这个例子,没有任何打嗝,但没有提到这个问题。 分析方面可能有一个解决方法(elasticsearch / kibana,对我来说),但是我首先想在解决这个问题之前尝试修复报告。 任何帮助深表感谢。 Ubuntu 14.04.1 LTS,收集5.4

划分VMware VM的networkingstream量

我们在VMware平台中混合使用托pipe和非托pipe虚拟机。对于托pipe虚拟机,我们使用虚拟机内的SNMP来绘制虚拟机的networkingstream量,如果客户超出限制,我们将使用这些stream量进行计费。 对于我们的非托pipe虚拟机,我们一旦虚拟机被移交给客户,我们无法绘制stream量使用图,因为大多数客户会使用防火墙locking虚拟机,和/或禁用/移除他们不需要或不想运行的服务。 是否可以绘制VMware vCenter中可用于计费目的的虚拟机网卡的stream量使用情况? 理想情况下,我们希望能够将它们导入Observium,以便将它们添加到Observiumstream量计数中进行计费。 我已经查看了Cacti和Observium,但是没有发现任何可以做到这一点的东西,理想的情况是,如果VMware vSphere分布式交换机支持SNMP,理想情况是好的,然后我们可以绘制虚拟交换机的端口。 我猜测它需要从VMware API中提取数据并将其呈现给graphics应用程序的正确格式。 我可能会一起拼凑一些东西,但是如果以前有人这样做,我宁愿不要重新发明轮子。

在同一台机器上使用不同插件的多个munin-node守护进程

我的公司最近搬到一个新的基础设施提供商。 我们得到了一个部分pipe理的服务器,并安装了Ubuntu 14.04。 该提供者还具有安装在机器上的munin-node(munin版本2.0.19),并具有用于监视的一些定制插件。 现在,我们也希望在改变供应商之前使用我们自己的监控。 我们有一个munin-master开始运行。 我们的监测包括我们自己开发的几个插件来监测我们的应用程序。 所以,虽然我不希望他们的插件,他们不需要我们的。 我们的一些插件也采用了读取时重置计数器。 这意味着只要允许我们在慕尼黑节点上的慕尼黑主人,另外从那里读取统计信息是没有解决办法的。 我真正需要的是在机器上运行的第二个munin-node守护进程。 我可以通过简单地复制init.d启动脚本,更改端口等来创build另一个插件目录,并在其中添加额外的插件。 但是,我找不到一种方法来改变慕尼黑使用的插件 。 我可以设置另一个configuration文件来读取,但似乎没有指定插件位置的选项。 对于munin-node也没有命令行选项(尽pipe像munin-run和munin-node-configure这样的其他脚本似乎也有它们)。 我尝试了使用Google,我已经在源代码中,但我找不到任何方法来实现这一点。

我如何沉默加载警报?

在构成我们的Nagios服务器的大量文件中,是负载的服务检查: define service{ use generic-service name check-load hostgroup_name nrpe-hosts,!webnodes,!build-cluster notification_options c,r service_description NRPE – Load check_command check_nrpe!check_load contacts irc } 和两个联系人: define contact{ contact_name irc alias ircbot host_notification_period 24×7 service_notification_period 24×7 host_notification_options d,u,r,f service_notification_options w,u,c,r,f service_notification_commands notify-by-epager host_notification_commands host-notify-by-epager pager [email protected] } define contact { contact_name pagerduty alias PagerDuty Pseudo-Contact service_notification_period 24×7 host_notification_period 24×7 service_notification_options […]

Nagios插件来监视FreeSWITCH

我正在尝试configurationNagios以监视FreeSWITCH,如https://github.com/kjhosein/nagios-freeswitch-plugin中所述 。 我已经从git下载脚本,并按照列出的步骤。 在远程(NRPE)服务器上,我在nrpe.cfg文件的下面添加了一行 command[check_freeswitch_health]=/usr/lib64/nagios/plugins/check_freeswitch_health.pl $ARG1$ 在Nagios服务器上,添加在commands.cfg文件中 define command { command_name check_freeswitch_health command_line $USER1$/check_nrpe -H $HOSTADDRESS$ -c check_freeswitch_health $ARG1$ } 并在services.cfg文件中 define service { host_name freeswitch01 service_description FreeSWITCH – Calls Count check_command check_freeswitch_health!-a '-q show-calls-count'!!!!!!! } 但是,在Nagios的web界面我越来越 CHECK_NRPE: Received 0 bytes from daemon. Check the remote server logs for error messages. 在远程服务器上,显示以下错误的日志(/ var / log […]

APM系统如何监控和收集机器交互?

所以我通常理解像New Relic这样的.NET应用程序 – CLR Profiler API是非常有意义的。 但我不明白的是,AppDynamics是如何理解服务器和仪器之间的关系,而不是实际上基于.NET的东西..任何人都可以阐明这些东西如何在内部工作?