系统监控服务器 Gind.cn

Nginx 504监控

我正在使用Nginx来反向代理一个nodejs实例，当一个外部服务试图调用一个特定的，安全的api端点时，这个实例会超时，产生504个错误。如何设置Nginx通知我（即通过电子邮件）当它服务于504？由于有问题的api端点是安全的，并且依赖于传递的特定信息，所以通用监视解决scheme将不起作用。我很惊讶，我没有find任何明确的信息后，如何做到这一点，谷歌search15分钟后。谢谢。

如何设置监视防火墙后面的节点

听起来可能听起来很蹩脚：我正在尝试为我们的生产系统configuration监控，这个系统由两个硬件盒和两个虚拟机上的ESXi组成。所有这些都隐藏在防火墙后面，如果需要，我们可以自行configuration。我的select是在Munin（我已经有经验）或Zabbix之间。我想保持生产系统尽可能的干净，（对我来说）合理的方法是把主服务器停止生产，所以它：不会消耗任何可能的关键任务资源即使整个系统由于某种原因无法到达，也会提供数据（至less从数据中可以看到发生了什么，什么时候发生了）整个生产系统不可达时会发出警报但是从文档中我看到，Zabbix和Munin都不支持这种设置。其实与Munin是可以做到的，但是我需要为每个需要监视的节点创build单独的fw端口转发规则，这对我来说听起来像是一种矫枉过正，并且给设置带来了复杂性。同时，似乎只有Munin在节点和主站之间提供了encryptionstream量，而Zabbix则不支持。尽pipe如此，对于慕宁来说，整个设置（除了fw规则）还是非常不平凡的。生产系统的VPN不存在问题（在IDC中拥有VPN的国家的法律问题）所以我的问题是：有没有更好的方法来实现我的目标？或者一些其他的工具可以做到这一点，我不知道？

MRTG没有给出准确的价值或转换错误？

举例来说：我有SNMP响应值59757296 ，通过conf（“一切照旧”）传递给MRTG。该值以字节为单位（我检查了目标设备的规格以及设备确认的Web界面）。理论上我应该在MRTG图中得到“58356.7”KB，但是我得到了“59682.5 KB”。我知道这是平均超过5分钟，价值有所不同（我已经手动监测的价值，它随机上升/下降5分钟超过200KB）。也许MRTG的KB值分为1000而不是1024？相关的MRTG设置： kMG[mem]: b,K ShortLegend[mem]: B

监视Windows服务器的最佳方法？

我在一家为小企业客户提供IT支持的公司工作。我的任务之一是执行服务检查，其中包括检查事件查看器的关键错误/警告以及DHCP和DNSpipe理控制台。客户工作站的事件查看器也被检查，但没有定期检查。是否有一个现有的解决scheme可以集中查看所有这些日志，以便我不必远程访问每个服务器，并为每个客户端反复做同样的事情？每个客户端都有一些版本的Windows服务器 – 从2003到2012 R2。

用于忍者主机监控的用户pipe理

我需要一些帮助与忍者主机监测（ http://www.op5.org/community/plugin-inventory/op5-projects/ninja ）。抱歉这么长的描述，但我希望这会帮助你更好地帮助我。目前我们使用nagios。我们不直接将用户与主机相关联，而是使用主机组并将用户分配到主机组，并且该主机组中的所有主机在Nagios的用户界面下对该特定用户可见。但忍者，一个用户可以看到他/她的主机/服务的细节。但摘要（网格/概述）不适用于这些主机/服务。如何启用摘要视图？另外，当通过特定用户login时，我看不到这些主机/服务的警报历史logging和通知历史logging。只有当pipe理员用户login时，我才能看到他们，这就是允许在nagiosconfiguration下查看所有主机/服务的用户。我进一步挖掘，发现showlog使用用户名parsing通过日志和打印出警报历史logging，无论如何，我可以有showlogparsing日志文件，并显示用户是联系人的主机/服务的日志。使用nagios这是可能的，例如，如果用户Alogin并且在hostgroup_abc下将host_a，host_b，host_c分配给他。该用户可以查看hostgroup_abc的hostgroup_abc，主机/服务详细信息和host_a，host_b，host_c及其各自服务的概述，还可以查看host_a，host_b，host_c的警报历史logging和通知历史logging，但我在ninja中看不到相同的行为。我可以看到他们的主机/服务细节，但我没有看到他们的总结和历史（警报和通知）。请随时问我是否需要任何关于我们的nagios和ninja设置的更多细节或任何问题。谢谢。

sar -B verses sar -W有什么区别？

我想了解为什么我的系统运行缓慢。我find了sar命令，但想知道sar -B和sar -W之间的区别我阅读手册页，我知道-B给我的分页统计和-W给我的交换统计。我想了解的是以下几点：这两组统计数据之间的相关性是多less？我什么时候应该关心-B和什么时候-W？即我应该关心每个命令的值？哪个统计与系统性能更密切相关谢谢

将ZFScaching统计信息添加到orca中涉及哪些内容？

我有兴趣将ZFScaching统计添加到现有的orca性能监视中。特别是我对echo :: memstat |的输出感兴趣 mdb -k 我仍然处于研究逆戟鲸configuration的早期阶段，并希望得到一些指导。我想知道这是否意味着将列添加到现有的orcallator输出。

双处理器服务器与双单处理器服务器？

思考我想购买哪个服务器体系结构。我没有任何经验，当谈到双胞胎甚至更多的主板每个案件。我想到http://www.supermicro.com/products/nfo/2UTwin2.cfm 。有没有人有与其中之一的经验？我想指定节点，并且由于NUMA是真正意义上的开发，所以我们希望保持简单，坚持使用单处理器系统，但是通过将所有东西放在一起来更有效地使用可用的机架空间。该系统的目标不是处理能力或存储，而是易于开发和简单。我们每个发达国家谈论20-200个服务器。

zabbix 3.0 + pg_monz 2.0 + PostgreSQLstream式复制

我在CentOS 7.2上有一个Zabbix 3.0实例，我添加了pg_monz扩展来监视我的PostgreSQLstream式复制。我目前在我的Zabbix界面有这个; DB1 host_groups PostgreSQL的 Linux服务器模板模板OS Linux 模板应用PostgreSQL SR 模板应用程序PostgreSQL SR集群 DB2 host_groups; PostgreSQL的 Linux服务器模板; 模板OS Linux 模板应用PostgreSQL SR 在“最新数据”选项卡上，过滤到host_group PostgreSQL DB1 pg.cluster.status 所有项目变灰 DB2 pg.cluster.status 主服务器数量1 正在运行的PostgreSQL服务器的数量1 备用服务器数量0 有人可以澄清设置监控stream复制，我敢肯定，我已经在我的模板混合了东西。我期望DB1显示一个主要的，两个运行postgresql服务器和一个备用服务器。这个文档对于pg_monz有点含糊。

什么是轻量级的方式来监测机架中的服务器的温度和负载

我知道Nagios和Sensu，但是我正在寻找一个简单，轻量级的解决scheme来监视和logging负载和温度数据。感兴趣的指标（按重要性排列）： CPU温度 HDD温度 GPU温度（nvidia） CPU负载花哨的仪表板来显示数据是不需要的。电子邮件警报，如果温度超过一定值，也是需要的。我已经读过，lm-sensors可以和cron作业一起使用来监测温度，并在超过阈值时发送电子邮件。不幸的是，我读过的教程基本上是过时的，或者有一个脚本没有什么解释。监控机架中服务器温度和负载的轻量级方法是什么？

Intereting Posts

MRTG + RRDTool小时图为什么合并活动目录如此艰难？ Debian服务器不会出现在PuTTY标题栏中 AWS IAM组：devise为最小权限 – 拒绝或允许 pidpet – groupid（gid）for mysql group在prod和dev之间有所不同在Ubuntu上通过NFSv4和Samba共享一个文件夹 build立一个小型的服务器设置 – 需要存储和冗余 – NAS或SAN？ Windows故障转移群集 – 尝试创buildMSDTCangular色 – AD权限问题？错误426错误读取networkingstream，'ftp_put'上传文件不完整，重新启动服务器时工作正常 yum remi和yumprimefaces库之间的主要区别是什么？为什么我只能在Solaris和VMware之间获得1Gbps？ application / x-httpd-php和application / x-httpd-php-source之间的区别如何从SQL Server查询caching中删除特定的错误计划？无法通过RDP连接到AWS EC2上的Windows Server实例用HAproxy + Apache减轻HTTP连接洪stream

Articles of 系统监控