Articles of 监控

在Zabbix屏幕上显示正常运行时间

我正在努力find一个适当的方式来显示在Zabbix屏幕上的正常运行时间。 我有一个屏幕显示有关每个正在运行的服务的健康信息:CPU和内存消耗,我想添加服务的正常运行时间。 数据本身被正确收集,Zabbix正确处理“最新数据”页面和相关简单图表上的正常运行时间值显示。 但是,我不知道如何在我的屏幕上显示相同的数据(即“N天,小时:分:秒”,而不是“nnnnnnn”秒)…

使用Nagios监视2个位置

由于我是Nagios的新手,我想问问是否有人知道如何使用Nagios监控2个物理位置。 例如,我们有两个互连的数据中心。 我已经build立了一个Nagios服务器来监视两个数据中心的服务。 但是,举例来说,数据中心1的连接已closures,因此您将无法查看其他数据中心。 我想要做的是,我想单独监控两个数据中心,我应该怎么做呢? 有2个Nagios服务器安装? 非常感谢您的帮助。 问候,Cip

Munin聚合不起作用(在服务器之间总计CPU时间)

我正试图获得一些服务器的CPU使用率的聚合图。 我已经拿出这个到目前为止: [totals] update no contacts no lb_cpu.graph_title LB Total User CPU lb_cpu.user.sum lb1.example.com:cpu.user lb2.example.com:cpu.user 不幸的是graphics生成不起作用。 日志显示这个错误: 2015/07/22 07:21:15 [RRD ERROR] rrdtool graph did not generate the image (make sure there are data to graph). 2015/07/22 07:21:15 [WARNING] Could not draw graph "/var/cache/munin/www/totals/lb_cpu-day.png": /var/cache/munin/www/totals/lb_cpu-day.png 任何人都可以发现我的configuration有什么问题吗? 谢谢 更新:我更新了我的示例,以反映我真的在做什么 – 即我没有添加一个组到聚合的节点名称,并使用来自另一个组的节点。

debuggingNagios通知失败

我花了一天在nagios上设置自定义的twitter通知。 一切似乎都已经到位,通知似乎被触发,但脚本不被调用。 我的通讯录configuration如下所示: define contactgroup{ contactgroup_name twittergroup alias twittergroup members user1 } define contact { contact_name user1 alias user1 service_notification_period 24×7 host_notification_period 24×7 service_notification_options c,r host_notification_options d,r service_notification_commands streamnotify-service-twitter-dm host_notification_commands streamnotify-host-twitter-dm } 一个典型的服务看起来像这样: define service{ use generic-service host_name ra-stream-monitoring-host servicegroups streaming_services service_description Stream / starrfm-redfm ingest stream check_command check_http_status!"http://somestream" contact_groups admins,twittergroup } 我的commands.cfg有这些条目: define command […]

Monit无法重新启动nginx

我已经开始在Ubuntu 12.04服务器上运行,监视nginx,但是我无法再次成功启动nginx。 我的设置是:monitconfiguration文件是: -rwx—— 1 root root 10329 2015-07-31 09:39 /etc/monit/monitrc 和monitrc文件的内容(非注释)是 set daemon 60 set logfile /var/www/apps/myapp/log/monit.log set httpd port 2812 use address mysite.com allow username:password 'password' check system mysite.com if loadavg (1min) > 4 then alert if loadavg (5min) > 2 then alert if memory usage > 75% then alert if cpu usage […]

我将如何监控和testing我的电子邮件服务是否从头到尾运行?

我最近搞砸了我们的DNS设置,并设法打破我们的电子邮件。 我盲目地遵循一些说明并为根域添加了CNAMElogging。 这有效地使mxlogging无效,而不是在同一根,并把所有的东西搞砸了。 花了24小时才注意到了这个问题。 我需要的东西会通知电子邮件被破坏了很多。 我环顾了互联网,发现一些服务,检查您的smtp和stream行服务器是否运行,但这是不够的。 我想要完整的testing,将发送一个单独的服务的电子邮件,并validation它已收到。

如何自动重新启动Apache文件更改

我正在使用apache编译000-defualt.conf文件,经常在vim,save和下次运行service apache2 restart 。 当对该文件进行更改时,有哪些选项可以自动重启apache?

相同的脚本,相同的操作系统,相同的安装,失败

所以我正在使用RANCID监视一些交换机,现在我正在使用clogin来testing一些修改。 我在两台不同的电脑上工作,但是他们都在办公室里。 虽然它们位于不同的子网上,但是它们都可以build立telnet和ssh连接到我正在使用的交换机( Alcatel Omni 6248 )。 我已经在两台计算机上进行了RANCID的默认安装,并添加了所需的一切。 不要打扰想念一个missconfiguration 所以我设法得到了一些交换机的configuration,但其中两个失败,所以我试图修改clogin所以它得到每一个路由器的configuration。 经过一些改变,执行 ./clogin -c "show running-config" alcatel-sw 会导致脚本login,执行 terminal datadump 然后等待提示,直到它得到一个TIMEOUT 。 在试图解决这个问题的时候,我只是决定获得默认的clogin并从零开始,所以我恢复了备份,并尝试login到一个CISCO交换机(这完全与默认的clogin脚本一起工作)。 我执行了 ./clogin -c "show running-config" cisco-sw 我得到了TIMEOUT ,好像我在使用旧的脚本。 我检查了它,不知道,我正在使用默认的。 我甚至转移了我在另一台计算机(我在发送之前testing)上的一个,并再次尝试得到相同的错误。 任何想法如何可以这样做? 我在同一台机器上的CentOS 7.2上,都在一个几乎全新的安装和clogin正在工作,直到我修改它,然后用备份副本replace它。

格拉法纳的CPU使用情况

我正在尝试在Grafana中绘制CPU使用率。 Collectd为InfluxDB提供指标,我从Influxdb获取指标进入Grafana。 我已经尝试了最后一个值的派生,但CPU是负的。 我希望它在百分比。 我有cpu空闲,中断,系统,用户。

仙人掌生成旧图

我有一个仙人掌系统(版本0.8.8b)。 仙人掌系统已经运行了一年。 我想生成追溯每日图,因为仙人掌不能显示旧的日常图。 如何生成旧的日常图表? 非常感谢你