无法添加新的munin节点到现有的munin主

我试添加一个节点到现有的慕尼黑主(我没有设置,但似乎工作正常,因为它显示了8个现有的节点图),我有一些麻烦。 以下是我遵循的步骤:

将该节点添加到/etc/munin/munin.conf

[server.example.org] address private.server.example.org 

主站的html目录是(匹配apacheconfiguration):

 htmldir /opt/munin 

该目录包含以下文件和文件夹:

 ls -lh /opt/munin/ drwxr-xr-x 20 munin munin 4.0K 2011-11-07 16:15 example.org <= FOLDER NAMED AFTER OUR DOMAIN -rw-r--r-- 1 munin munin 2.5K 2010-08-03 14:11 definitions.html -rw-r--r-- 1 munin munin 3.0K 2010-08-03 14:11 favicon.ico -rw-r--r-- 1 munin munin 15K 2011-11-07 16:21 index.html <= MAIN MUNIN PAGE -rw-r--r-- 1 munin munin 1.8K 2010-08-03 14:11 logo-h.png -rw-r--r-- 1 munin munin 473 2010-08-03 14:11 logo.png -rw-r--r-- 1 munin munin 5.6K 2010-11-03 14:07 style.css 

index.html的页脚表明这个文件是由munindynamic生成的,所以我知道我不必碰这个文件。

 This page was generated by <a href='http://munin-monitoring.org/'>Munin</a> version 1.4.4 at 2011-11-07 16:21:30+0000 (UTC) 

域目录包含所有节点的文件夹。 我最终创build了一个新的节点希望它会帮助,但没有任何区别

 mkdir /opt/munin/example.org/server.example.org chown munin:munin -R /opt/munin/example.org/server.example.org 

我杀了munin-cron并重新启动它,但是也没有任何区别。

 $ sudo su munin munin-cron start $ sudo ps aux | grep munin-cron munin 26566 0.0 0.2 4092 584 ? Ss 16:35 0:00 /bin/sh -c if [ -x /usr/bin/munin-cron ]; then /usr/bin/munin-cron; fi munin 26567 0.0 0.2 4092 576 ? S 16:35 0:00 /bin/sh /usr/bin/munin-cron 

穆宁节点

安装了munin-node包

 apt-get install munin-node 

修改/etc/munin/munin-node.conf文件以允许来自munin master的accces

 host * allow ^A\.B\.C\.D$ # master IP address port 4949 

重新启动的munin节点

 service munin-node start 

如果我在新节点上运行一个tcpdump,我可以看到一些数据正在与主交换,所以我相信在这一点上configuration主服务器是个问题。

任何想法,我正在发布或如何进一步解决这个问题?

其他故障排除

据build议我检查了日志

$ grep server.example.org /var/log/munin/munin-update.log

 2011/11/08 08:40:03 [WARNING] Config node server.example.org listed no services for server.example.org. Please see http://munin-monitoring.org/wiki/FAQ_no_graphs for further information. 2011/11/08 09:10:02 [INFO] Reaping Munin::Master::UpdateWorker<example.org;server.example.org>. Exit value/signal: 0/0 

警告将我带到这个页面http://munin-monitoring.org/wiki/FAQ_no_graphs 。 我按照build议给予的步骤后面的步骤。 虽然符号链接似乎是正确创build的,但是我运行了命令munin-node-configure --shell | sh -x 相信解决问题的munin-node-configure --shell | sh -x 。 前面提到的页面还build议改变我设置的host_name (尽pipe我不相信这有帮助,因为其他工作节点没有configuration它)。

当我到达它时,telnet故障排除是成功的

 $ telnet private.server.example.org 4949 Trying ABCD.. Connected to private.server.example.org. Escape character is '^]'. # munin node at server.example.org > nodes server.example.org . > list server.example.org cpu df df_inode entropy forks fw_conntrack fw_forwarded_local fw_packets if_err_eth0 if_err_eth1 if_eth0 if_eth1 interrupts iostat iostat_ios ip_A.BCD irqstats load memory open_files open_inodes postfix_mailqueue postfix_mailvolume proc_pri processes swap threads uptime users vmstat > fetch df _dev_sda1.value 23.1295909196156 _dev.value 1.2890625 _dev_shm.value 0 _var_run.value 0.00782368542525642 _var_lock.value 0 _lib_init_rw.value 0 

我看不到任何明显的错误与您的设置。 我会提出两件事。

  • 阅读在这位慕尼黑大师的日志。 /var/log/munin/munin-update.log是开始的地方。 如果你有确认更新成功的条目,并且你得到/var/lib/munin/的rrd文件 – 继续到munin-graph.logmunin-html.log

  • validation主站是否能够连接到munin-node的地址。 请用netcat或类似的testing: nc private.server.example.org 4949 。 预期的输出应该是: # munin node at hostname 。 可能的错误是数据包被防火墙丢弃(而nc将挂在connect() ,如果使用strace则可见),或者未能parsing名称(而netcat输出nc: getaddrinfo: Name or service not known )。

如果尝试完上述内容后找不到任何东西,请粘贴master的完整munin.conf文件(如果必须,请将数字IP地址与数字匿名化,主机名使用一些伪造文本)。

不是太less见的错误; cron-job可能在某些时候被root调用,其中一些文件具有root拥有权,并且不能由munin用户更新,他们通常需要对/ var / lib / munin中所有文件的写入访问和html目录。

嘿,我有同样的问题。

检查主机上的/ etc / hosts文件,然后重新检查第一个主机名是否与您在服务器上的munin conf文件中指定的主机名相同。

总是破坏了我们的设置,直到我们发现。

我们的/ etc / host被设置为:1.2.3.4 hostname hostname.domain

Munin conf被设置为hostname.domain。 服务器认为它被命名为主机名而不是hostname.domain ..