Articles of 性能监视

监视可以运行脚本的服务

目前我正在使用New Relic的性能监控服务。 迄今为止工作很好,除了我想自动化一些东西。 当性能不佳或我的网站停机时,我基本上只是收到一封电子邮件通知。 如果站点closures了,我想尝试重新启动应用程序服务器(如果有必要的话,会中止进程)。 如果在一段时间之后不起作用,请尝试重新启动整个机器…我甚至为PageRDuty付费,它可以parsingNew Relic电子邮件通知,并通过电话或短信通知升级程序。 但它不能运行脚本… 似乎这将是任何网站监控工具的stream行function…有什么好的呢?

dm_exec_query_stats返回的工作时间大于经过的时间

我经常查询sys.dm_exec_query_stats来查找昂贵的查询。 我注意到在某些情况下,total_worker_time大于total_elapsed_time。 有谁知道为什么会这样? 我现在正在看一个例子,其中last_worker_time大于last_elapsed_time。 也许工作时间是多个处理器/内核之和?

在购买之前,如何判断一个存储arrays是否可以通过SNMP提供某些性能计数器?

我注意到内置于设备的SNMP报告文档(即不需要在OS中运行的代理)通常不包括可用于监视的性能计数器的列表。 似乎设备的MIB将揭示什么柜台可用,但我不知道,我也无法findMIB的权威来源。 我发现一个可能有代表性的MIB是相当神秘的。 所以,我留下了这些问题: 你怎么知道哪些性能计数器(或通过SNMP的任何数据)可用于设备? 假设我有一个设备的MIB,我该如何解释每个MIB对象的含义? 背景: 现在我正在查看戴尔MD3200 。 我正在拍摄一些顺序的读写目标,并希望对存储arrays进行testing,以防我不能达到这些目标。 这是我第一次尝试使用SNMP进行性能监视。

Linux的DD:有没有办法redirect输出监控?

有时候我工作场所的服务器会出现一些奇怪的现象,它发生在世界各地的不同DC的随机物理机架上。 似乎在同一个机架内的不同机器之间以及同一个机架中的一个机架与另一个机架之间存在networking带宽问题。 每个机架中的所有服务器都有一个到同一个DC中的操作服务器的挂载点。 有时,当奇怪的行为发生…似乎没有足够的带宽之间的各种机器和复制文件到操作服务器上的挂载点花费太长时间。 为了在发生这种情况时测量问题,我运行以下命令: dd if=/dev/zero of=/proxy_dump/test1.dat bs=1024 count=102 该命令在操作服务器上的/proxy_dump安装点上填充test1.dat文件。 在运行正常的服务器上,输出结果如下所示: [root@nyproxy5 ~]# /bin/dd if=/dev/zero of=/proxy_dump/test1.dat bs=1024 count=102 102+0 records in 102+0 records out 104448 bytes (104 kB) copied, 0.003486 seconds, 30.0 MB/s [root@nyproxy5 ~]# 在networking问题期间在有问题的服务器上: [user@ams2proxy24 ~]$ dd if=/dev/zero of=/proxy_dump/test1.dat bs=1024 count=102 102+0 records in 102+0 records out 104448 bytes (104 kB) copied, […]

如何保证VPS的CPU时间?

我提供VPS和处女Debian它经常挂起:简单的ssh命令响应太久。 这是坏的 :( 我做了基准:每2分钟开始ffmpeg转换30秒低质量video。 通常需要3秒,但在挂机时间约20秒。 另外我每隔2分钟就打VPS。 图表是一样的。 performance良好的时间间隔约为15分钟,差25分钟左右 您可以使用https://docs.google.com/spreadsheets/d/1XYQV-5mompcFidOHL7XzbvvrVnjn_ZHnvBaND6RrrVY/edit?usp=sharing 另一台服务器从这个主机 同样的情况,但不要批评 如何避免这种情况? 似乎,在同一个专用服务器上托pipe的neigbour VPS会定期启动高CPU加载任务。 也许这是系统备份或相同的任务。 据我所知,内存是有保证的,但不是CPU。 另外我从这个主机上有另一个VPS,它似乎没问题(它也有相同的峰值,但远远less于) 专用服务器对于这个项目来说太贵了。 这是主机托pipe的情况,更换提供的是坏主意

平均。 磁盘队列长度计数器使用外部RAID磁盘arrays时?

我意识到,许多人build议我们看看其他计数器,如sec / Read和sec / Write,而不是Avg。 磁盘队列长度。 不过,我有一个关于这个特殊的柜台的问题: 通常build议平均值。 磁盘队列长度不能大于2.正如我经常看到的,它不应该大于2 +“物理磁盘”中的主轴数量。 这是我很好奇的。 如果我正在使用外部RAID系统,操作系统是否将其视为一个物理主轴? 当使用这个计数器时,我还会考虑arrays中物理主轴的数量吗? 一些洞察这如何工作将是有益的。

Windows Vista中的可靠性问题发生了什么?

Vista有这个可靠性监视器工具杰夫谈论编码恐怖,但现在在Windows 7中有一种称为可靠性监视器是不同的和愚蠢的。 你如何得到好的回来?

统一Linux服务器利用率监控

我使用了大量的工具来监视不同types的服务器负载(Linux / Apache / MySQL / PHP) – top,iostat和netstat,以及我自己的脚本测量。 我使用脚本和电子表格收集和总结数据,以全面了解我的服务器正忙于什么。 有一个简单的工具/守护进程,我可以安装在Linux下,安静地坐在后台,收集所有这些信息在适当的时间间隔,然后提供简单的每日/每周/每月摘要让我阅读?

如何跟踪Ubuntu / Apache / MySQL / Rails + Passenger堆栈中的性能问题?

我在Ubuntu 8.04服务器上运行Apache 2.2.9,MySQL 5.1,Passenger 2.2.9和Rails 2.3.8(ruby 1.8.7-p72)的Rails堆栈有性能问题。 我如何跟踪堆栈中的性能问题?

Apache性能监控和容量规划指南

有人能指点我一个Apachenetworking农场的性能监控和容量pipe理指南吗? 其他问题提出了一些工具,但我也有兴趣了解各种性能参数,如何调整它们,configuration设置之间的折中等。 Web场大多是Weblogic层的反向代理,使用weblogic wlproxy在Weblogic服务器之间进行负载平衡。 它终止了SSL连接,除此之外,除了传递weblogic和weblogic外,其他方面都做得很less。 (硬件)负载均衡器面向Web服务器。 我已经看到了这个 🙂