Articles of 系统监控

如何安全地收集多个服务器数据进行监控

我有一个“pipe理员”服务器,可以访问所有的pipe理GUI。 我也有2个其他的服务器,1个网站和1个分贝。 当我为nodejs server / api扩展时,我想知道如何将服务器信息传输到我的pipe理服务器。 到目前为止发现的可能性: 情况1 使所有服务器生成带有top输出的jsons文件,例如在压缩文件中encryption。 pipe理服务器通过ssh / sftp连接到远程服务器,并每隔一小时抓取一次该文件。 优点:易于实施,缺点:不是真正的时间 情景2 在每台服务器上安装nodejs + socketio并连接到pipe理服务器以发送/接收数据 优点:实时,易维护,缺点:安全风险?,可能有多台服务器守护进程在每台服务器上运行,增加漏洞。 难以执行? 我从来没有实现这样的事情,我知道有这样的aio包,但问题是,它更难以修改,因为你没有编码。 或者,也许有一个我没有听说过的神奇工具? 感谢您的投入。 使用的操作系统:Debian 8和Ubuntu 16.04服务器:Nginx / Php,Nodejs / ES6,RethinkDb,MariaDB,Redis位置:USA NL

使用外部networking从内部系统访问内部页面?

我有点新鲜。 我正在build立一个Zabbixnetworking检查内部服务。 但是URL需要从内部networking外部获取以获得正确的输出。 理想情况下,我不想设置VPN的东西。 我有什么办法可以解决这个问题? 有像提供API的httpstatus.io服务吗? 任何其他的想法,我没有想到? 在select要做什么之前,我想知道所有的选项。 谢谢大家

如何将此curl命令转换为PRTG传感器?

所以我有这个cURL命令,我想转换成一个PRTG传感器。 任何想法如何可以做到? 这是cURL命令: curl 'https://host.com/api' -H 'referer: https://www.mycompany.com' –data-binary '{"request":{"searchRequest":{"limit":0},"tracking":{}},"metadata":{"project":["mycompanywebsite"],"collection":["mycollection"],"user-agent":["curl"]}}' 这是输出: {"searchResponse":{"totalResults":"29525","time":"235.41µs"}} 我创build了一个新的HTTP Advance传感器,但是我不确定它是否正常工作(请参见下面的图片)。 谢谢

监视AIX 5.3 LPAR的内存

我目前正在通过HMCpipe理IBM Power 740服务器。 我们有四个运行的LPAR,两个VIOS LPAR,一个应用程序LPAR和一个数据库LPAR。 我们已经实现了lpar2rrd来监视整个服务器(CEC)上的CPU使用情况和内存,我们也可以监视每个LPAR的CPU使用情况。 但是我们无法监控每个LPAR的内存。 我们被要求绘制每个LPAR的内存使用情况,以便服务台的人们可以监视LED显示器的内存。 我知道vmstat和svmon命令; 我正在考虑parsing其中一个命令的某些属性,并用Processing对它们进行graphics化。 有没有其他方法可以做到这一点?

监视每个应用或IP的带宽使用情况

我想监视每个应用程序或每个IP的带宽使用情况,目前我正在使用wireshark来完成这项工作,但是有没有专门用于这种types工作的软件? 谢谢

智能通知(谁联系什么)在Icinga

我已经安装了Icinga 1.10,我正在使用NagiosQL来configuration它。 我有点在调整警报和通知。 Icinga暗示inheritance。 假设我们有一个名为prodweb01的生产Web服务器。 它有两个服务检查运行在它上面。 一个检查Apache是​​否正在工作,另一个检查JVM是否正在工作。 没有为任何检查设置警报设置,因此它从主机inheritance这些设置。 主机inheritance两个主机模板 – 通用Linux主机(其中有系统pipe理员的联系人)和通用networking主机(其中有开发人员的联系人)。 有没有办法编写逻辑,以便如果Apache停机,系统pipe理员会得到警报,如果JVM停机,开发人员会收到警报? 这甚至是做事的最好方式吗? 这种方法对于我们来说会很乏味,因为我们有一些被环境和angular色分隔的主机。 所以我们必须为每个服务器angular色(例如api,app,web等)创buildprod / non-prod通用Linux主机模板和prod / non-prod模板。 我们将不得不这样做,以便非prod通知不去短信,而prod的人做,因为我还没有看到一种方式告诉Icinga通过短信警报通过电子邮件prod和通过电子邮件非prod 。 要做到这一点的唯一方法似乎是为同一个人创build两个不同的联系人,一个使用SMS,一个使用电子邮件并根据环境将其应用于模板或主机。 编辑:我知道有人可能会指出,为什么我不只是在服务本身定义的警报/通知设置? 是的,可以做到这一点,但仍然没有解决如何分离产品和非产品警报的问题。 在这种情况下,解决scheme是创build两个版本的相同的服务检查,并在一个设置短信提醒和另一个电子邮件。

格拉法纳的CPU使用情况

我正在尝试在Grafana中绘制CPU使用率。 Collectd为InfluxDB提供指标,我从Influxdb获取指标进入Grafana。 我已经尝试了最后一个值的派生,但CPU是负的。 我希望它在百分比。 我有cpu空闲,中断,系统,用户。

Zabbix:更多function的主机上的模板inheritance触发器的不同通知阈值?

我有Zabbix 3.0pipe理几十个左右的Linux服务器。 所有这些模板都有“模板操作系统Linux”模板,如果有超过30个进程正在运行,则会有一个“正在运行的进程太多”的警告触发器。 但是对于这些机器中的less数,我认为可以有超过30个正在运行的进程,我希望触发器是50或60个。其他机器应该保持在30的阈值。什么是最好的行动来实施呢? 我可以创build一个额外的模板,只有改变阈值触发器,并适用于主机? 相关地,如果主机的两个模板对同一个项目有不同的触发器,我是否必须手动禁用每个主机的“旧”触发器? 我重申“运行的进程数”只是一个例子。 同样的问题可以适用于任何项目。

服务器性能和磁盘使用门户?

我正在寻找一个良好的基于​​Web的门户网站,以便在内部生产服务器上安装,以便向在命令行上没有该服务器的login权限的用户提供有关服务器运行状况的信息。 典型信息包括磁盘剩余容量,进程运行状态,networking容量图,磁盘和CPU。 理想情况下,该门户将支持Linux和Windows服务器上的安装。

监视多个Linux主机上的重要日志文件?

我在AWS上运行了几台服务器,并且使用Nagios / Icinga来监控所有关键服务。 我们试图找出最好的方法来监视system, DB, PHP, Apache, etc所有日志( system, DB, PHP, Apache, etc ),以便通过电子邮件立即知道问题(例如,Apache max_clients昨天达到了max_clients阈值)。 我们现在只在服务closures后查看日志,而不是在之前,这是不好的。 我是Linuxpipe理新手,在线search后,我已经确定了以下选项: Nagios脚本来监视日志 – 问题是大多数一次检查一个特定的正则expression式的日志文件。 为每个日志文件安装一个服务是不可扩展的(我甚至不知道我们必须监视的所有日志文件!) 像logrobot.com这样的服务 – 我不确定这是多么有效。 感谢您的build议,以最less的configuration在多台服务器上监控所有这些日志的最佳方式。