Articles of 监视

有没有可能使用Zabbix来监视进程?

我在我的一些专用服务器上安装了zabbix-server , zabbix-proxy和一些zabbix-agent 。 一切正常,我对所有事情都很满意,但是我对这个话题感到好奇: 监控stream程 。 我想要的是: 我希望Zabbix能够监控进程(CPU和RAM的使用情况,正常运行时间等),监控networkingstream量,CPU使用率等等,所以我可以看到它们的graphics,制作屏幕等等。 至今: 从谷歌search,我发现可以创build一个自定义脚本,然后可以执行,所以你可以告诉脚本做你想做的任何事情,但我试图完成不同的东西,你可能已经注意到以上部分 题: 那么,甚至有可能以任何方式做到这一点? 如果是这样,我应该从哪里开始?

如何计算Grafana,graphite和collectd每天或每小时的带宽使用情况?

我想收集每天或每小时服务器发送和接收的字节,以便收集带宽需求。 我想设置grafana,石墨和collectd收集带宽使用指标,但这些只显示每秒的带宽使用情况。 我可以使用这些信息来计算在某个时间段内发送的字节,还是需要考虑新的解决scheme? 当前收集的数据示例,每秒以字节为单位的eth0传入和传出带宽。

确认/忽略X min / hrs / days的nagios警报?

我有一个正确注意到问题的Nagios服务。 我正在那台机器上运行一个命令来解决这个问题。 然而,这将需要几个小时的运行。 在此之前,Nagios仍然(正确)将其检测为问题。 我可以“承认”这个问题,我不会再收到通知,但是如果我的清理命令有问题,除非我记得重新检查,否则我不会知道这个问题。 是否有一定的时间“承认”一个nagios问题? 在那之后,如果还是有问题的话,按照常规发送一个nagios警报? sorting“忽略这个问题的下一个X分钟/小时/天”? 一个nagios问题的“打盹”button?

如何使用Prometheus和Grafana监控REST API延迟

我想监视我的Tomcat服务器上的请求处理延迟。 稍后将基于此执行一些警报将是很好的。 我使用%D模式configuration了Tomcat阀门,因此它将logging访问日志文件中处理每个请求的时间。 从这些对数线计算50,90,99个百分点的正确方法是什么? 我已经为基本主机指标(cpu / mem,hdd)configuration了Prometheus和Grafana,但是我不清楚如何正确计算百分位数,并用prometheus / grafana来绘制它们。 想法是检测应用程序hicckups,并在它完全没有响应之前作出反应。 谢谢大家!

monit – “如果成功则执行exec”

我在成功执行脚本时遇到了问题。 ~/.monitrc : check host example.com with address example.com if failed url http://example.com/startpage and content == "mainBaner" timeout 10 seconds then exec "/usr/local/bin/monit_example_error.sh" else if succeeded then exec "/usr/local/bin/monit_example_ok.sh" 如果出现错误,它似乎运行脚本,但在没有错误的情况下则不会。 日志显示testing运行并成功,/ /var/log/monit.log /log/ /var/log/monit.log : [CEST Jun 8 12:24:52] debug : 'example.com' succeeded testing protocol [HTTP] at INET[example.com:80/startpage] via TCP [CEST Jun 8 12:25:22] debug […]

在生产数据库上运行死锁分析器的资源消耗

这是众所周知的 运行分析器会根据正在监视的事件消耗大量资源。 我有意监测偶尔发生的死锁(每周3〜5次)。 使用SQL Server分析器和以下事件select(每个事件,但是从TSQL_Locks模板突出显示的事件) 是否放慢监控(整整一周不停)只locking生产数据库? 有没有什么经验法则来运行探查器的死锁时间和时间?

硬件build议进行远程监控

我们正在开展一个项目,要求将PC部署到不同的地点,并将各种数据报告给中央服务器,并对硬件上的build议感兴趣。 我们有以下要求: 监控软件依赖于某些USB设备的第三方Windows驱动程序,并且是用.NET编写的,因此这些软件必须运行Windows XP / Vista / 7 / server并且至less有一个USB。 我们希望能够远程pipe理他们,只需要前往他们的硬件故障。 如果在停电的情况下,一旦恢复供电,他们自己恢复正常。 我们更喜欢戴尔,惠普等知名厂商的“现成”硬件。 越便宜越好。 我们正在考虑上网本,小型台式机和刀片服务器。 你会推荐什么样的具体模型?

如何在Linux服务器(RHEL 5)上存储客户端(Windows XP)的击键?

如何在Linux服务器(RHEL 5)上存储客户端(Windows XP)的击键? 我想在工作时间监视我的员工在办公室的每一个动作, 击键logging器应用程序 活动logging器 logging任何聊天,互联网信使或电子邮件客户端键入的击键 剪贴板监视屏幕截图 制造商发送日志到电子邮件 我该怎么做?

报告的带宽使用情况在iproute2和ifconfig之间有所不同

我的团队有一台服务器,用于使用FOG对我们的工作站进行映像。 我有点好奇,看看我们使用了多less带宽。 当我运行ifconfig eth0 ,TX / RX线路被读取 RX packets:166949376 errors:0 dropped:0 overruns:0 frame:0 TX packets:350126730 errors:0 dropped:0 overruns:0 carrier:0 collisions:0 txqueuelen:1000 RX bytes:31757576798 (29.5 GiB) TX bytes:458006556301 (426.5 GiB) 但是当我运行ip -s link show eth0 ,等效的输出是 RX: bytes packets errors dropped overrun mcast 1693647583 166958818 0 0 0 18979 TX: bytes packets errors dropped carrier collsns […]

监视进程何时开始使用太多的内存

我有一个Debian服务器,其中一些进程不时stream氓,并开始消耗太多的内存。 我怎么能在stream程级别监控这个,所以我可以设置一个警报? 目前我监视当服务器开始使用太多的内存,但我想单独监视进程。