昨天我的zabbix服务器版本2.2.21崩溃了两次。 我附上日志文件。 http://speedy.sh/hhjjt/log-1.txt http://speedy.sh/ddTTw/log-2.txt Zabbix服务器正在使用以下机器: CPU: Intel(R) Xeon(R) CPU X5660 @ 2.80GHz CPU: Intel(R) Xeon(R) CPU X5660 @ 2.80GHz CPU: Intel(R) Xeon(R) CPU X5660 @ 2.80GHz CPU: Intel(R) Xeon(R) CPU X5660 @ 2.80GHz HDD: 682G RAM: 9.65162 G 在同一台机器上,我有所有的组件zabbix(前端,服务器,分贝)。 为了确保zabbix服务器始终在运行,我将以下脚本添加到crontab中 #!/bin/bash SHELL=/bin/bash PATH=/usr/lib64/qt-3.3/bin:/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin:/root/bin echo $(date +%d/%m/%Y-%H:%M) service=zabbix_server if (( $(ps -ef | grep -v grep […]
我使用“模板SMNP接口”来监视交换机。 它给了我这样的关键:ifOutOctets [16] 我想有一个涵盖所有端口的项目: MaxOutOctets = max(ifOutOctets[*]) 我可以在图表中使用。 我已经阅读https://www.zabbix.com/documentation/2.2/manual/config/items/itemtypes/calculated,但我似乎无法得到正确的语法。
我做了一个外部脚本(用Perl编写的snmp_max_io)。 使用IP地址运行时,它将inputlogging到系统日志,并输出一个64位数字值,并将退出值设置为0。 示例输出: 916418801 我已经把它添加到/ usr / lib / zabbix / externalscripts中,我有一个不同的脚本,工作。 我已经configuration了一个项目: types:外部检查 键:snmp_max_io [“{HOST.CONN}”] 主机接口:ipnr 10050 信息types:数字 数据types:十进制 单位:b 一段时间后,Zabbix将状态更改为:“不支持”和“接收值[]不是数字”。 在命令行上以root用户或zabbix运行时,该命令正常工作。 但是这个命令永远不会被zabbix服务器运行(没有任何logging)。 我怎么知道为什么Zabbix认为命令返回[],而显然从来没有运行它? 解决scheme在注释中:脚本必须是bash脚本。 所以一个perl脚本必须有一个bash包装器。
server: Cisco C220 M3 Zabbix 2.4 Ubuntu 14.04 ipmitool的作品 user1@zabbix3:~# ipmitool -I lanplus -H 192.168.1.45 -U admin -P Password1 -A MD5 sel SEL Information Version : 1.5 (v1.5, v2 compliant) Entries : 158 Free Space : 45600 bytes Percent Used : 5% Last Add Time : 03/05/2015 08:15:22 Last Del Time : 11/22/2014 05:25:06 Overflow […]
我正在CentOS 6上本地testingZabbix,但是这个将会在Red Hat上安装和configuration,而且没有yum。 我在网上find的所有说明都给了我yum的指南。 有包还是可以有人帮我手动打包?
我正在努力find一个适当的方式来显示在Zabbix屏幕上的正常运行时间。 我有一个屏幕显示有关每个正在运行的服务的健康信息:CPU和内存消耗,我想添加服务的正常运行时间。 数据本身被正确收集,Zabbix正确处理“最新数据”页面和相关简单图表上的正常运行时间值显示。 但是,我不知道如何在我的屏幕上显示相同的数据(即“N天,小时:分:秒”,而不是“nnnnnnn”秒)…
最近我遇到了这样的情况,当“标准”磁盘空间监视失败时 – Zabbix使用vfs.fs.size项来检查磁盘使用情况,这在配套的模板中进行了logging和预configuration。 问题: 当文件被删除,但文件描述符/句柄仍然是打开的 – 磁盘可能会被填满,但在这种情况下Zabbix将报告没有用法。 在这种情况下,如何监视磁盘空间?
我想通过在zabbix中使用UserParameter来检查MySql是否启动。 UserParameter看起来像这样。 UserParameter = mysql.ping,sudo mysqladmin ping | grep -c alive | wc -l 当我执行mysqladmin ping | grep -c alive mysqladmin ping | grep -c alive在服务器中mysqladmin ping | grep -c alive ,它给了我正确的回应。 #mysqladmin ping | grep alive | wc -l 1 但是当我尝试以zabbix用户的身份运行该命令时,出现以下错误: #sudo -u zabbix sudo mysqladmin ping | grep alive | wc -l mysqladmin:连接到服务器'localhost'失败的错误:'拒绝访问用户'root'@'localhost'(使用>密码:否)' […]
我是zabbix世界的新手,我创build了一个特定的脚本,每半小时运行一次。 这个脚本返回(通过sys.exit(X))0如果一切正常,1为警告,2临界; 3未知(好吧,我想到了它的Nagios / centreon风格,我有这些经验)。 我可以通过执行su – zabbix python3 /usr/lib/zabbix/externalscripts/NBackupWD.py ignoredarg -c companyname 如果有警告或关键问题,输出是文本+退出代码,如果没有问题,则输出退出代码。 所以我用“NBackupWD.py [-c companyname]”这个键创build了一个名为“Backups”的项目,但是从现在开始,我迷了路。 如何让zabbix执行它并改变该返回码的function的触发器状态? 我知道我需要创build一个项目,然后将其链接到一个触发器(如何?),文档是非常不清楚的,没有提到适应返回代码触发相应的状态(如果脚本发送退出代码2,然后警告..就像在纳吉奥斯…) 另外,你能指出如何在界面中添加它吗? (如果可能的话,截图),因为在谷歌,许多迹象是针对2.4.2之前的版本,据我所知在这个版本的脚本行为有所改变。 谢谢!
我有一个问题,哪个好的解决scheme(软件/硬件)已经在企业中开发并应用于在线故障预测? Zabbix,Openstb,仙人掌和类似的替代品? 你能列出更多吗? 你能描述他们有什么优点和缺点,特别是在故障预测方面? 我想知道它们的缺点,并通过模型\algorithm进行一些改进。 如果您对在线故障预测的概念不太了解,请参考以下说明。 如果你已经知道了,就跳过它。 Online failure prediction — It is an approach to evaluate whether an incoming failure will occur in the near future, and when the failure will occur, and in which component (maybe software or hardware) the failure will occur. It's a short-term prediction by tracking failure, detected error reporting, […]