性能pipe理器 – 什么柜台?

目前我们正在考虑从传统的服务器环境转向SAN / VMWare环境。

我被要求收集主要服务器的性能统计数据 – DC,文件服务器,Exchange,看看它是否对我们的环境是可行的,或者如果我们将要遇到SAN性能问题。

我已经运行了8小时以上的计划基线,包括很多计数器,但是结果日志太大而无用 – 大约需要三分钟的时间才能打开它们,或者让我们查看不同的计数器。

虽然我一般都知道哪些是有用的,看性能是一个足够的列表来监视,这将给我们一个有用的起点,也是什么柜台将是有用的。

我在想

  • CPU性能
  • 磁盘/文件
  • networking使用情况
  • 活跃指令(GPO,login等)

但是柜台是最有用的,还有哪些地方应该特别针对我们的关注?

可能会杀死你的最大的是磁盘IO。 收集每秒的事务数和每秒读取/写入的扇区数将使您开始确定在SAN上需要什么。 同时关注内存和页面文件的使用情况,这可以对你的磁盘IO状态做坏事,并且为你的虚拟机configuration一些额外的内存很简单。

networking可能是下一个最重要的networking,但这非常简单 – 每秒汇总传输和数据包,确保它不是太荒谬。

根据我的经验,CPU是现代系统中可能性最小的瓶颈。 除非您有多台机器始终如一地固定在CPU上,否则我宁愿不要担心。 如果用完CPU,则configuration额外的VM服务器很简单。

经过多一点研究,我认为这是一个很好的通用计数器列表:

逻辑磁盘

  • 平均磁盘秒数/读取
  • 平均磁盘秒/写
  • % 空闲时间

记忆

  • 所使用的字节数
  • 可用MBytes
  • 免费系统页面表项
  • 页/秒
  • 池NonPaged字节
  • 池分页字节

networking

  • 字节总数/秒
  • 输出队列长度

物理磁盘

  • % 空闲时间
  • 平均磁盘秒数/读取
  • 平均磁盘秒/写
  • 平均磁盘队列长度
  • 平均磁盘字节/秒

处理

  • 处理计数
  • 私人字节
  • 线程数

处理器

  • %中断时间
  • 处理器时间百分比
  • %用户时间

系统

  • 处理器队列长度
  • terminal服务器(可选)
  • 活跃期
  • 非活动会话
  • 总会话

对于磁盘绑定,我喜欢监视每个物理磁盘的“\ PhysicalDisk(…)\ Current Disk Queue Length”。

对于使用perfmon查看问题的问题:尽pipe这可能超出了您所做的范围,但是我使用check_nt插件和安装在客户端上的nsclient ++来监视Nagios的Windows计数器。 然后我可以使用n2rrd来绘制所有graphics ,我也可以使用rrdtool来创build自定义graphics。

你列出的所有东西通常运行在vmware / san环境中。 这实际上只是一个关于SAN和虚拟服务器需要多么强大以及正确的体系结构的问题。 如果你愿意花钱购买一个昂贵的SAN,那么供应商应该能够告诉你你需要什么。

根据您的使用情况,磁盘IO和networking似乎是迁移到VMWaretypes基础架构时最为关心的问题,特别是如果您的虚拟机存储在SAN上,您肯定应该评估所有机器的networking使用情况和磁盘IO你会迁移。 大多数用于VMWaretypes的服务器应该有很多的NIC,但是仍然值得注意的是可以使用多less个NIC,以及SAN上磁盘的速度。 VMWare ESX支持不立即将所有磁盘更改写回虚拟机的function,因此您可以通过这种方式节省某些性能。

测量性能,我们使用RRDTool来访问性能,如凯尔所说,这是非常有用的。

虚拟机不像典型的服务器,因为你遇到了不同领域的问题。 大多数情况下,CPU不是瓶颈资源,而是RAM。 在你进入之前要真正了解的事情:

  • 磁盘吞吐量您的存储速度有多快? MB / read,MB / write均为平均值和峰值(如本文其他地方提到的,RRDTool对此很有帮助)。 您是否知道您的峰值是什么时候的,以及它们是否与存储在同一ESX群集上的其他VM上的I / O峰值一致。 在我们的环境中,备份是最高I / O时间,但是我们在白天会发生突发事件。 对此的回答将告诉您是否可以脱离使用文件备份的磁盘,或者是否必须将当前的LUN指向虚拟机。
  • networking吞吐量知道你需要多快。 如上所述,备份是我们开始尝试使我们的NIC饱和的区域。 知道你有多less数据。 我很确定那里有可以做VLAN标记的NIC,如果你的networking基础设施支持它,这可以减轻负载平衡问题。
  • 内存蠕变知道你的程序。 我们有一个会消耗给它的每一点内存,这会导致VMWare控制台发牢骚并抱怨使用情况,并build议给予更多。 如果你不像我们那样悲惨的资金不足,希望你的ESX服务器configuration大量的RAM。 在我们的环境中,如果需要超过1GB的内存,我们认为虚拟机是“小猪”。 你可能会有所不同。

确定是否可以使用文件支持的磁盘,或者是否需要直接显示的LUN,可能需要了解一些信息。 直接呈现的LUN是您的存储arrays将LUN直接呈现给VM的位置,通过使用NPIV可以使其更容易。 你可以在没有NPIV的情况下做到这一点,但是对于你的血液来说可能太危险了,所有全新的光纤通道硬件都应该支持它,而ESX 3.5当然也是如此。 直接呈现方式可以删除存储arrays和虚拟机之间的抽象层,从而使得I / O性能更好。 然而,直接呈现设置起来更麻烦,并且在“围绕它”的阶段有更高的启动时间。

文件备份的磁盘更简单。 另外,它们可以非常简单地在存储arrays之间移动(对于某些简单的复制多GB文件的值而言),这是直接表示需要(通常非常昂贵的)arrays级复制软件来完成的。 低I / O负载的东西工作只是在文件支持,甚至一些更高的I / O事情桃色。 我们正在为文件备份磁盘上的超过3000个用户运行完整的Exchange 2007安装。 备份可能会更快,但在白天用户不会注意到任何减速。