我正在使用Nginx来反向代理一个nodejs实例,当一个外部服务试图调用一个特定的,安全的api端点时,这个实例会超时,产生504个错误。 如何设置Nginx通知我(即通过电子邮件)当它服务于504? 由于有问题的api端点是安全的,并且依赖于传递的特定信息,所以通用监视解决scheme将不起作用。 我很惊讶,我没有find任何明确的信息后,如何做到这一点,谷歌search15分钟后。 谢谢。
听起来可能听起来很蹩脚: 我正在尝试为我们的生产系统configuration监控,这个系统由两个硬件盒和两个虚拟机上的ESXi组成。 所有这些都隐藏在防火墙后面,如果需要,我们可以自行configuration。 我的select是在Munin(我已经有经验)或Zabbix之间。 我想保持生产系统尽可能的干净,(对我来说)合理的方法是把主服务器停止生产,所以它: 不会消耗任何可能的关键任务资源 即使整个系统由于某种原因无法到达,也会提供数据(至less从数据中可以看到发生了什么,什么时候发生了) 整个生产系统不可达时会发出警报 但是从文档中我看到,Zabbix和Munin都不支持这种设置。 其实与Munin是可以做到的,但是我需要为每个需要监视的节点创build单独的fw端口转发规则,这对我来说听起来像是一种矫枉过正,并且给设置带来了复杂性。 同时,似乎只有Munin在节点和主站之间提供了encryptionstream量,而Zabbix则不支持。 尽pipe如此,对于慕宁来说,整个设置(除了fw规则)还是非常不平凡的。 生产系统的VPN不存在问题(在IDC中拥有VPN的国家的法律问题) 所以我的问题是: 有没有更好的方法来实现我的目标? 或者一些其他的工具可以做到这一点,我不知道?
举例来说: 我有SNMP响应值59757296 ,通过conf(“一切照旧”)传递给MRTG。 该值以字节为单位(我检查了目标设备的规格以及设备确认的Web界面)。 理论上我应该在MRTG图中得到“58356.7”KB,但是我得到了“59682.5 KB”。 我知道这是平均超过5分钟,价值有所不同(我已经手动监测的价值,它随机上升/下降5分钟超过200KB)。 也许MRTG的KB值分为1000而不是1024? 相关的MRTG设置: kMG[mem]: b,K ShortLegend[mem]: B
我在一家为小企业客户提供IT支持的公司工作。 我的任务之一是执行服务检查,其中包括检查事件查看器的关键错误/警告以及DHCP和DNSpipe理控制台。 客户工作站的事件查看器也被检查,但没有定期检查。 是否有一个现有的解决scheme可以集中查看所有这些日志,以便我不必远程访问每个服务器,并为每个客户端反复做同样的事情? 每个客户端都有一些版本的Windows服务器 – 从2003到2012 R2。
我需要一些帮助与忍者主机监测( http://www.op5.org/community/plugin-inventory/op5-projects/ninja )。 抱歉这么长的描述,但我希望这会帮助你更好地帮助我。 目前我们使用nagios。 我们不直接将用户与主机相关联,而是使用主机组并将用户分配到主机组,并且该主机组中的所有主机在Nagios的用户界面下对该特定用户可见。 但忍者,一个用户可以看到他/她的主机/服务的细节。 但摘要(网格/概述)不适用于这些主机/服务。 如何启用摘要视图? 另外,当通过特定用户login时,我看不到这些主机/服务的警报历史logging和通知历史logging。 只有当pipe理员用户login时,我才能看到他们,这就是允许在nagiosconfiguration下查看所有主机/服务的用户。 我进一步挖掘,发现showlog使用用户名parsing通过日志和打印出警报历史logging,无论如何,我可以有showlogparsing日志文件,并显示用户是联系人的主机/服务的日志。 使用nagios这是可能的,例如,如果用户Alogin并且在hostgroup_abc下将host_a,host_b,host_c分配给他。 该用户可以查看hostgroup_abc的hostgroup_abc,主机/服务详细信息和host_a,host_b,host_c及其各自服务的概述,还可以查看host_a,host_b,host_c的警报历史logging和通知历史logging,但我在ninja中看不到相同的行为。 我可以看到他们的主机/服务细节,但我没有看到他们的总结和历史(警报和通知)。 请随时问我是否需要任何关于我们的nagios和ninja设置的更多细节或任何问题。 谢谢。
我想了解为什么我的系统运行缓慢。 我find了sar命令,但想知道sar -B和sar -W之间的区别 我阅读手册页,我知道-B给我的分页统计和-W给我的交换统计。 我想了解的是以下几点: 这两组统计数据之间的相关性是多less? 我什么时候应该关心-B和什么时候-W? 即我应该关心每个命令的值? 哪个统计与系统性能更密切相关 谢谢
我有兴趣将ZFScaching统计添加到现有的orca性能监视中。 特别是我对echo :: memstat |的输出感兴趣 mdb -k 我仍然处于研究逆戟鲸configuration的早期阶段,并希望得到一些指导。 我想知道这是否意味着将列添加到现有的orcallator输出。
思考我想购买哪个服务器体系结构。 我没有任何经验,当谈到双胞胎甚至更多的主板每个案件。 我想到http://www.supermicro.com/products/nfo/2UTwin2.cfm 。 有没有人有与其中之一的经验? 我想指定节点,并且由于NUMA是真正意义上的开发,所以我们希望保持简单,坚持使用单处理器系统,但是通过将所有东西放在一起来更有效地使用可用的机架空间。 该系统的目标不是处理能力或存储,而是易于开发和简单。 我们每个发达国家谈论20-200个服务器。
我在CentOS 7.2上有一个Zabbix 3.0实例,我添加了pg_monz扩展来监视我的PostgreSQLstream式复制。 我目前在我的Zabbix界面有这个; DB1 host_groups PostgreSQL的 Linux服务器 模板 模板OS Linux 模板应用PostgreSQL SR 模板应用程序PostgreSQL SR集群 DB2 host_groups; PostgreSQL的 Linux服务器 模板; 模板OS Linux 模板应用PostgreSQL SR 在“最新数据”选项卡上,过滤到host_group PostgreSQL DB1 pg.cluster.status 所有项目变灰 DB2 pg.cluster.status 主服务器数量1 正在运行的PostgreSQL服务器的数量1 备用服务器数量0 有人可以澄清设置监控stream复制,我敢肯定,我已经在我的模板混合了东西。 我期望DB1显示一个主要的,两个运行postgresql服务器和一个备用服务器。 这个文档对于pg_monz有点含糊。
我知道Nagios和Sensu,但是我正在寻找一个简单,轻量级的解决scheme来监视和logging负载和温度数据。 感兴趣的指标(按重要性排列): CPU温度 HDD温度 GPU温度(nvidia) CPU负载 花哨的仪表板来显示数据是不需要的。 电子邮件警报,如果温度超过一定值,也是需要的。 我已经读过,lm-sensors可以和cron作业一起使用来监测温度,并在超过阈值时发送电子邮件。 不幸的是,我读过的教程基本上是过时的,或者有一个脚本没有什么解释。 监控机架中服务器温度和负载的轻量级方法是什么?