Articles of 监控

如何在GNU / Linux上以每虚拟主机为基础监视PHP站点的资源使用情况?

使用prefork MPM在RHEL上通过apache2.4 / mod_php运行一堆PHP站点。 我的阿帕奇孩子正在使用公平的内存和大量的CPU。 我希望能够在每个虚拟主机的基础上对RAM / CPU的使用进行分类。 我的一个想法是使用PHP-FPM并为每个虚拟主机创build一个工作池。 但是,我不清楚我是否可以命名或标记工作进程,以便可以有意义地汇总资源使用统计信息。 我觉得大共享主机以前一定会遇到这个问题。 有任何想法吗?

警报被困时如何使Nimsoft运行脚本?

我们希望configurationNimsoft Alert Server [NAS]运行脚本,从服务器收集触发警报的其他数据。 例如:当服务器XYZ发出CPU使用率警报时,NAS应该运行返回并针对服务器XYZ运行脚本来收集其他数据,例如运行的应用程序。 我有一个基本的PowerShell脚本,收集所需的数据,这里的问题是,我公司聘请configurationNimsoft的供应商告诉我,脚本必须存储在每台服务器本地,不能集中存储。 此外,他们告诉我,Nimsoft至多只能执行脚本并按时间表报告脚本输出,而不是在警报被困时。 这似乎是BS,所以我在这里寻求澄清。 是否有可能configurationNimsoft执行PowerShell脚本,可以存储和执行从NAS,当警报被困?

使用单行命令获取linux进程的实时CPU使用情况,并且获得简单的结果

我到处search,一无所获。 我正在尝试创build一个显示由PID指定的一个进程的CPU使用情况的小规格。 我需要命令来打印一个简单的答案,所以为什么top -p $ pid不好。 该命令由PHP执行,需要立即打印响应。 与我需要的东西密切相关的东西是 sudo ps -p $pid -o %cpu 但经过testing和search一些更多,我发现这打印的过程开始以来的平均使用量。 我需要从命令运行的那一刻起的实时使用,就像上面显示的一样。 这可能吗? 编辑:: $cmd = 'sudo sh -c "top -n1 | awk \'/30100/ {print $9}\'"'; echo exec($cmd); 尝试没有壳 $cmd = "sudo top -n1 | awk '/30100/ {print $9}'"; echo exec($cmd); 仍然没有结果,它不回应任何东西

Ipvsadm监视负载平衡器上的连接

我正在努力在第一个时期使用两个后端Web服务器在负载平衡器上设置Haproxy。 我面临的问题是监视每个Web服务器的连接数。 我已经试过用ipvsadm这个工具做这个,但是在阅读之后,我真的不确定如何使用这个工具来监视,而不是用它作为“转发 – 负载平衡工具”。 我试图设置它,但它是完全错误的,因为我只想监视连接到我的后端服务器与此工具。 有没有人有build议如何做到这一点? 我也希望有关如何制作图表的任何提示。 要添加服务器: ipvsadm -A -t 10.0.33.15:80 -s rr 添加Web服务器: ipvsadm -a -t 10.0.33.15:80 -r 10.0.33.18 –m ipvsadm -a -t 10.0.33.15:80 -r 10.0.33.19 -m

使用外部网站作为健康检查是否合理?

我有一个4台代理服务器分布在几个数据中心,为广域网上的大量用户提供服务。 这些负载均衡使用位于每个站点的F5 GTM。 我的目标是为我的负载平衡器写一个健康检查,如果代理服务器closures,或者Internet的本地pathclosures,代理服务器就会closures。 在我看来,对我来说最完整的方法是通过代理使我的负载均衡器探测外部URL。 使用我自己的Web服务器将不会是一个有效的检查,因为连接将不需要离开数据中心,以通过检查。 我感到不公平,甚至是不道德的,让我的负载均衡器每天每隔一段时间向第三方URL请求,以检查我的代理的健康状况。 我的问题是这样的:例如,Google会不会一直在等他们的网站遭到这样的要求呢? 有没有更好的select,或任何网站致力于互联网信标?

在没有OMSA的情况下,监控从Dell Linux服务器驱动器的状态

我有一些服务器,出于各种原因,我无法安装戴尔OMSA工具集。 通常,我为硬盘configuration了硬件RAID(PERC)。 而且,我的大多数服务器都configuration了iDRAC(带外pipe理)。 有没有办法检查我的服务器磁盘的状态(错误,预测失败,健康)? 我在一台机器上尝试了IPMI,但似乎没有提供这些信息。 它应该在脚本中工作,因为最终目标是在Zabbix中进行整合。

使用OpenNMS监视HP MSA2324sa

在有人build议在这里扫描SCSI总线后,我能够将HP MSA2324sa存储arrays连接到服务器。 现在,我想使用SNMP和OpenNMS监视存储上的以下内容: a)驱动器的健康状况b)PSU状态 但是,我正在努力工作。 SNMP在存储arrays上configuration,但是当我扫描节点时,我仍然没有得到有关磁盘和PSU的任何信息。 这应该自动发布,还是我应该手动添加OpenNMS中的东西?

App Engine监控仪表板适用于多个应用程序

我在Google App Engine上运行了一些webapps。 我正在寻找一个监控仪表板,可以在同一页面同时显示来自多个App Engine应用程序的基本运行状况指标(HTTP响应代码,延迟等)。 理想情况下,它也应该直接从Google的API中提取指标,而不是要求我来testing代码。 到目前为止,我看到的所有内容都只显示一个应用程序: Google Cloud Console ,Google的Android应用程序 , Stackdriver , Datadog等.HawkEye看起来可能有效,但它并没有设法我的应用程序的指标呢。 我试着用每个应用程序的监视仪表板的iframe来制作一个简单的HTML页面,但Google用X-Frame-Options阻止它。 :/ 此外,这些是副项目,所以我愿意支付一点,如果需要,例如$ 10 /月,但不是更多。 ( 从StackOverflow手动迁移到此处 )

从外部监视zabbix服务器(本身)

我有一些Zabbix服务器监视的基础设施(服务器,交换机等),设置为在发生问题时提醒; 到现在为止还挺好。 但是,如果Zabbix服务器本身(或任何底层的下层)遇到问题呢? 一个想法是发布某种心跳,可以通过外部系统进行监控。 我正在考虑使用Zabbix API(可能使用py-zabbix)通过http公开它,并使用像监视器 .us一样的监视器进行监视。 在我冒险之前,我不禁想知道是否已经有了一些简单的东西来掩饰这个问题? 或者这是一个好方法? 与自定义Python脚本相比, monit会是更好的方法吗? (不知道这是否通过了“简单”testing)…

监控Marathon框架的可用性

我正在使用Mesos – Marathon进行应用程序部署和可用性,但有时马拉松会冻结。 我试图监视TCP端口,但在冻结端口打开,从而无法检测到故障? 任何build议的监测?