监视和报告页面错误以确定内存问题

我正在configuration一个针对我的域中的所有服务器的性能监视器。 我使用WhatsUp Gold 16.2来发送警报,当我们达到一定的阈值。 我最近读了微软的一篇文章,达到150页/秒是一个可接受的门槛。 WUG的问题是我能测量的最小单位是一分钟。 我想过要乘以150 * 60,并发出9000多的警报,但这似乎并不是一个很好的内存压力指标

我的一个系统pipe理员创build了一个监视器,一旦我们在30分钟内发生了4000多页错误,就会发出警报。 我不认为这比我上面提出的监视器更好。

4000页故障监视器的示例:

物理,而不是VM Server 2003 R2 w / SP2在远程办公室中用作域控制器32位4 GB RAM 4 GB页面文件2个过程2.8 GHz

RAM 30天图:平均:18.5%最高:26.6%

虚拟内存30天图:平均:5.38%最大:6.66%

上述系统在30分钟内发出超过4400页的错误警报。 数据显而易见,没有内存压力可言,4000页的故障监控也不是一个好的问题指标。

我的环境大部分是虚拟的(VMWare和Hyper-V),主要是VMWare。 大多数服务器都是Server 2008的变体,2003年很less,几个2012年。很less有物理的。

我的问题真的归结为:

我应该监测什么样的门槛,并以高达1分钟的采样率发出警报?