我怎样才能让Zabbix在一个图表中显示来自多个主机的相同项目? 我想比较不同主机上的项目。
如何在Zabbix中查看屏幕或视图,在那里我可以看到类似Nagios的状态列表中的所有或所有有问题的服务/主机? 下面是一些不熟悉Nagios的Nagios问题服务状态列表截图。 我看起来很高和低(手动,谷歌,论坛,常见问题),但无法find一个。 概述是压倒性的,仪表板小部件只给出了摘要,触发器不是由主机分组的,而且当存在问题时也是压倒性的。 Zabbix中的性能和graphics效果令人惊讶,但这些状态页面对我来说是杀手级的function。
我有zabbix监控多台服务器(Linux和Windows)。 是否有可能让zabbix自动化服务,他们closures自动重启?
首先,我正在运行CentOS 6.5并尝试使用Zabbix 2.2.4。 任何主机名已被示例所取代。 我已经在Zabbix机器上安装了以下RPM(主机名为zbx-hostname): zabbix-java-gateway-2.2.4-1.el6.x86_64 zabbix-web-2.2.4-1.el6.noarch zabbix-agent-2.2.4-1.el6.x86_64 zabbix-server-2.2.4-1.el6.x86_64 zabbix-2.2.4-1.el6.x86_64 zabbix-web-pgsql-2.2.4-1.el6.noarch zabbix-server-pgsql-2.2.4-1.el6.x86_64 我的PostgreSQL机器上安装了PostgreSQL 9.2,RPMS(主机名为db-hostname): postgresql92-9.2.8-1PGDG.rhel6.x86_64 postgresql92-libs-9.2.8-1PGDG.rhel6.x86_64 postgresql92-server-9.2.8-1PGDG.rhel6.x86_64 我的zabbix_server.conf文件如下所示: LogFile=/var/log/zabbix/zabbix_server.log LogFileSize=0 PidFile=/var/run/zabbix/zabbix_server.pid DBHost=db-hostname DBName=zabbix-dbname DBUser=zabbix-user DBPassword=zabbix-password DBSocket= DBPort=5432 我的zabbix的PHPconfiguration如下所示: $DB['TYPE'] = 'POSTGRESQL'; $DB['SERVER'] = 'db-hostname'; $DB['PORT'] = '5432'; $DB['DATABASE'] = 'zabbix-dbname'; $DB['USER'] = 'zabbix-user'; $DB['PASSWORD'] = 'zabbix-password'; // SCHEMA is relevant only for IBM_DB2 database $DB['SCHEMA'] […]
我有一个Zabbix的自定义用户参数,它调用一个硬件RAID CLI工具(arcconf / megacli)并检查是否有任何arrays降级。 由于这些工具是纯粹的,所以我configuration了sudoers来允许zabbix用户无需密码的访问: Defaults:zabbix !requiretty Cmnd_Alias ZABBIX_MEGACLI_CMDS = /opt/MegaRAID/MegaCli/MegaCli64 -LDInfo -Lall -aALL zabbix ALL = (ALL) NOPASSWD: ZABBIX_MEGACLI_CMDS 在CentOS 5上,zabbix_agentd运行不受限制,一切正常。 在CentOS 6上,该代理现在在独立的zabbix_agent_t域中运行。 这造成了问题。 最初,sudo二进制文件本身无法执行,但是我添加了这个策略: sudo_exec(zabbix_agent_t) 现在它以不同的方式死亡了: type=AVC msg=audit(1407137597.193:157): avc: denied { create } for pid=3145 comm="sudo" scontext=unconfined_u:system_r:zabbix_agent_t:s0 tcontext=unconfined_u:system_r:zabbix_agent_t:s0 tclass=unix_dgram_socket type=SYSCALL msg=audit(1407137597.193:157): arch=c000003e syscall=41 success=no exit=-13 a0=1 a1=80002 a2=0 a3=1 items=0 ppid=3121 pid=3145 auid=0 […]
这应该是简单的,所以这很可能是我的方法完全closures,有人希望刺激我走向正确的方向。 我们有一个Zabbix 2.0.3服务器实例,用于监视一堆不同的服务器,但现在我们需要设置它来监视和通知有关SQL Server 2008 R2故障转移主动 – 被动群集的任何警报。 本质上,这是一个2服务器集群,当其中一个节点可以在给定的时间“活动”,提供所有SQL Server相关的请求,而另一个服务器只是“睡觉”,从任何人login服务器 – 拥有所有与SQL Server相关的服务处于停止状态。 我们已经尝试在两台服务器上设置Zabbix代理,使用SQL Server 2005模板(我们找不到任何2008特定版本,而2005版本在监视2008 R2实例方面似乎总能正常工作),并为Zabbix服务器configuration服务器,但是我们最终会持续警报服务器当前是集群中的被动服务器。 我们已经能够查find实际监控故障转移的各种方法,但是我们还没有find任何有关如何指导Zabbix的指导,在这种情况下,只希望组中的一个服务器处于在线状态,而另一个可以被丢弃,不应该提出任何警报。 我希望我自己清楚。 感谢您的任何指导。 我没有想法。
我们使用Cacti和RRDTool来监视和分析大约1,000个基于Linux的节点上分布的大约100,000个计数器。 但是,我们目前的设置通常只给我们5分钟的图表(有些数据是基于分钟的)。 我们经常会在“接近实时”看到反馈意见的地方做出改变。 我需要一个星期5或10秒的数据,一年的1分钟的数据和5年的10分钟的数据。 我有SSD磁盘和一个双六核服务器备用。 我试着build立一个Graphite /碳/私语服务器,并且有大约15个节点pipe道连接到它,但是在升级到较老的桶时,它只有“平均”的保留function。 这几乎是无用的 – 我想要最小值,最大值,平均值,标准偏差,也许可能是“总数”和“样本数量”,或者可能是“第95百分位数”。 开发人员声称有一个新的后端“testing版”,允许您编写自己的function,但是这似乎仍然只保留1:1(当保存较旧的数据时,您确实希望将统计信息计算为来自单一的input,另外,“testing版”对于这个安装似乎有点冒险,如果我错了这个假设,我会很高兴能够显示我的错误! 我听说Zabbix推荐,但它把数据放入MySQL或其他SQL数据库。 5秒间隔100,000个计数器意味着20,000 tps,而我有一个SSD,我没有一个带电池备份caching的8路RAID-6,我想我需要这样做:-)再一次,如果这实际上不是问题,我会很高兴能看到我的方式的错误。 另外,Zabbix可以做单一的数据stream – >统计推广吗? 最后,Munin声称现在有一个新的2.0版本正在“testing版”中出现,它拥有定制的保留计划。 然而,这又是“testing”部分 – 是否有人将其用于真实和规模? 它是如何执行的,如果是这样的话? 我几乎想要使用graphics前端(如Graphite),并使用mmap()和一些统计信息之上的简单图层来滚动自己的保留后端。 这不会特别困难,并且可能performance得非常好,让内核找出在刷新到磁盘的频率和进程操作之间的平衡。 任何其他的build议,我应该看看? 注意:它必须certificate自己能够维持上面所build议的数据加载types; 如果你能指出你所引用的具体实现,那么更好!
我正在尝试使用Zabbix 1.8.4来监视日志文件。 我使用以下详细信息创build了一个项目: Host: Zabbix server Description: logger_test Type: Zabbix agent (active) Key: log[/tmp/scribetest/test3/test3_current,error,,100] Type of Infromation: Log Update interval (in sec): 1 sec Keep history (in days): 90 Status: Active Applications: Log files 我创build了一个触发器,并使用以下详细信息将其附加到项目logger_test : Name: logger_test_trigger Expression: {Zabbix server:log[/tmp/scribetest/test3/test3_current,error,,100].str(error)}=1 Severity: disaster 以上设置第一次正常工作,但下次触发器显示ZBX_NOTSUPPORTED ,之后该项目还显示“不支持”消息。 你能告诉我,我在这里做错了什么吗?
我需要在我们的Zabbix系统中实现一些networking检查,这需要使用libcurl (curl)选项来编译Zabbix,但是我不知道如何检查是否使用这个选项来编译。是否有任何命令或文件这将帮助我find答案?
我更新一个我的freebsd框到9稳定(全新安装)并安装net-snmp进行监控。 uname -r 9.1-PRERELEASE pkg_info net-snmp-5.7.1_7 Information for net-snmp-5.7.1_7: Comment: An extendable SNMP implementation …. cat /var/db/ports/net-snmp/options # This file is auto-generated by 'make config'. # Options for net-snmp-5.7.1_7 _OPTIONS_READ=net-snmp-5.7.1_7 _FILE_COMPLETE_OPTIONS_LIST= IPV6 MFD_REWRITES PERL PERL_EMBEDDED PYTHON DUMMY TKMIB DMALLOC MYSQL AX_SOCKONLY UNPRIVILEGED OPTIONS_FILE_UNSET+=IPV6 OPTIONS_FILE_UNSET+=MFD_REWRITES OPTIONS_FILE_SET+=PERL OPTIONS_FILE_SET+=PERL_EMBEDDED OPTIONS_FILE_UNSET+=PYTHON OPTIONS_FILE_SET+=DUMMY OPTIONS_FILE_UNSET+=TKMIB OPTIONS_FILE_SET+=DMALLOC OPTIONS_FILE_UNSET+=MYSQL OPTIONS_FILE_UNSET+=AX_SOCKONLY OPTIONS_FILE_UNSET+=UNPRIVILEGED 我在这台机器上有大约500个vlan,并且通过snmpd收集有关界面的信息到2个不同的软件zabbix和cacti。 并且他们都绘制了空白字段的图表。 […]