我一直在CentOS7.2上首次设置了sensu,但是我一直没有能够得到它的工作: 我似乎无法连接到API。 Uchiwa给出了错误: ALERT Datacenter site1 returned: Connection error. Is the Sensu API running?` 我已经试过了: curl -I http://localhost:4567/clients …我没有得到回应。 这里是/var/log/sensu/sensu-api.log http://pastebin.com/wHEHE0bH 我一直在创build一个脚本,使设置可重复。 请参阅下面的脚本显示我的configuration: http ://pastebin.com/QEt5Msku如果您在CentOS7上运行该脚本,它应该重复这个问题。 固定: 问题在下面的答案。 按照一个非官方的指南,在一个新的虚拟机上成功安装了sensu后,我比较了两个设置步骤,并在新build虚拟机的几个版本之后,逐步更换了一些步骤,我想通过非官方指南指出一个稍微不同的URL修复了我的问题(对于CentOS6的回购,但它在7上工作,它只是安装一个非当前版本0.20.3)。 echo '[sensu] name=sensu-main baseurl=http://repos.sensuapp.org/yum/el/6/x86_64/ gpgcheck=0 enabled=1' > /etc/yum.repos.d/sensu.repo
场景: 操作系统: CentOS 7.2 Zabbix版本: 3.0 尝试使用SNMP协议监视一些交换机 我能够监控他们没有任何问题,所有项目都工作,一切都很好,但添加每个项目是一个痛苦的屁股,我不浪费几个小时,所以我开始使用Googlesearch了一下,发现Zabbix Extras ,这似乎解决了我的问题,但还没有,因为最后的版本是Zabbix 2.4。 无论如何,我试图安装它,但如所料,没有成功。 我一直在试图find一个替代scheme,到目前为止,所以这基本上是我的最后一次机会… 希望有人可以帮忙,否则我会杀死自己,然后加500物品/开关哈哈
我一直想使用Spiceworks一段时间,并在过去几年中安装了几个版本,包括新发布的4.0。 我知道那边有一个很大的社区,但是很难浏览,我注意到有几个Spiceworks支持者在这里。 我在Spiceworks上遇到的一个大问题是,似乎没有办法正确地跟踪计算机组件和外围设备。 无论Spiceworks通过WMI检索它的库存,似乎都是一成不变的。 也就是说,如果Spiceworks将监视器检测为“即插即用1024 x 768”,则无法告诉它监视器实际是什么,也没有办法input序列号等。对于内部来说也是如此组件。 目前我使用GLPI + OCS-NG,这是一个系统的灾难。 但是我喜欢GLPI的是我可以跟踪外围设备和其他东西。 如果我有人抱怨UPS发出了一个呼叫,我可以查看他们的电脑,看看哪个UPS连接,并在我的路上拉一个新的电池。 如果有人打电话说他们的显示器在早上第一件事情就不会出现十分钟,我可以把显示器放在GLPI上,检查保修信息。 像这样的事情是方便的。 有了Spiceworks,我不相信这是不可能的,只需添加自定义字段,这就意味着大量的复制,粘贴或以其他方式转录序列号,就像外围设备在机器之间移动一样。 去年我在Spiceworks上抱怨过这个,并得到了一些积极的反馈,但是我不太会想到。 如果你正在使用Spiceworks,你是怎么处理这个问题的? 有什么我在这里失踪?
我是MOSS / SharePointpipe理新手。 任何可以帮助我监视/报告MOSS的公用事业上的指针? 另外,是否可以为每个站点使用的存储空间生成特定于站点的报告?
目前是否有使用Nagios3监控CPU使用情况,不涉及SNMP设置? 我想设置通知,如果我超过了某个阈值,比如55%的CPU时间正在被系统使用。
我收集了一些运行情况,将CPU使用率或networking带宽等性能状况放入rrd文件中。 我的问题是,我有一个单一的文件集群中的每个节点。 我如何获得我的集群的概述图? (例如我有5个节点发送每个10Mbit,所以graphics显示50Mbit)
我在EC2上build立了我的第一个生产实例,并且要确保我已经完成了所有必要的监控。 有三种不同types的东西我想监测: 实例是否正在运行? 如果底层硬件发生故障,EC2实例可以在不发出警告的情况下终止,并且据我所知,它们不会自动重新启动。 所以,如果没有,开始备份。 UNIX是否正常运行? 这是关于CPU负载,磁盘空间等常见的东西 该网站是否响应? 如果没有,请重新启动它。 我最初在云外的一台物理服务器上设置了Nagios,但它实际上只对项目2有帮助。它可以告诉我实例是否消失了,或者网站没有响应,但是据我所知,执行任何命令来解决这个问题。 我在这个问题上search了许多选项 – 仙人掌,Monit,上帝,Ganglia,现在可能更多,我忘记了。 我没有时间研究这些。 我知道亚马逊的Cloudwatch,但似乎并没有做任何我的Nagios安装尚未做的事情。 如果你已经有了这样的东西,可以请你分享一下对你有用的东西吗?
我正在尝试使用jconsole监视远程jvm。 我需要通过OpenVPNnetworking进行监控,这可能是我的一部分问题。 这是networkingconfiguration: Server A Server B Server C Jconsole JVM 10.171.0.1 <—> 10.170.0.1 <—> 10.170.0.14 当所有服务器都在不同的物理networking上时,它不起作用。 当Server A和Server C在同一个物理networking中工作。 在这两种情况下,traceroute都是networkingconfiguration中描述的traceroute,如下所示: traceroute to 10.170.0.14 (10.170.0.14), 64 hops max, 52 byte packets 1 10.170.0.1 (10.170.0.1) 114.440 ms 109.152 ms 109.581 ms 2 10.170.0.14 (10.170.0.14) 234.207 ms 228.535 ms 229.630 ms 任何想法如何解决这个问题? [编辑] 所有的系统都是linux。 Jmx的远程参数是: -Dcom.sun.management.jmxremote.port=8086 -Dcom.sun.management.jmxremote.ssl=false […]
Ubuntu Server 10.04.1 x86 Munin 1.4.4 以下是Munin告诉我有关通过服务器上的防火墙进行连接的内容: 这是什么netstat -n必须说这个: $ netstat -an | awk'/ tcp / {print $ 6}'| sort | uniq -c 2 CLOSE_WAIT 1closures 3720成立 34 FIN_WAIT1 21 FIN_WAIT2 13 LAST_ACK 6听 4 SYN_RECV 394 TIME_WAIT 根据netstat ,10%的套接字在TIME_WAIT ; 按照Munin的说法,75%或更多。 真奇怪 谁是对的? 有关configuration的更多细节等等: 如何减lessTIME_WAIT中的套接字数量?
所有, 我需要远程监视一个窗口框,如果发生故障,我需要收到一封电子邮件。 值得注意的是,这个盒子需要每晚重新启动,有时在白天也是如此。 所以短暂的5分钟或更短的停机时间是可以的。 但是,更长的停机时间应该会触发电子邮件提醒。 如果晚上发生故障,我不想收到大量的电子邮件,只有一个通知我,所以我可以在早上把它拿回来。 我目前的想法涉及到使用net-snmp和滚动我自己的python脚本来监视框。 这当然是在重新发明轮子。 但是我一直没有find任何我想要的FOSS。 要么他们比必要的更复杂,或者期望您检查他们的控制面板,或者没有一个明显的方法来监视箱子是否与我想要的选项联机。 我想知道是否有我错过的工具,这是我想要的。 或者失败了,什么被认为是这种应用程序的最佳实践? SNMP会提供我需要的信息,还是我还需要做其他的事情? 我需要注意的python脚本中的任何陷阱? 备选scheme和build议表示欢迎,尤其是如果它们包含链接或样本以指向正确的方向。