标题很多解释它。 比方说,有100台服务器,各种版本的Windows和Linux,一台Windows服务器就是“主时钟”。 我看过这个问题: 我如何在Linux和Windows之间同步时钟? 这暗示ntp可以做我想要的,如果我在客户端(?)上运行“ntpd -q”。 如果我安装ntp,我也需要保证它只会同步我强制的时间。 更好的是,如果我有一个日志,告诉我每次执行同步。 我正在做基准testing,我需要能够这样说:“时钟在主时间09:42:01在所有的基准testing系统上同步,然后启动基准testing并允许运行6个小时在这个时间间隔内,系统时钟都没有改变。“ 我知道随后会出现时钟漂移,但现在我们正在做这些事情,而且我正在用手动过程来做。 我宁愿至less自动化一次性同步。
我有一个服务器执行多个任务来通过它的stream量。 最近服务器一直在口吃。 当系统窒息时,它会重新启动 – 这就给我留下了一些关于窒息的病理信息(这肯定不是一个暴力的崩溃)。 您的经验中有哪些工具可帮助您保留有关系统扼stream圈的有意义的数据。 这可能是内存消耗,“ps”,“top”或任何其他参数。 请注意,一个简单的输出几个冗长的命令(ps -a)的脚本可以使用大量的存储,而且很难分析。
对不起,下面的文字墙。 在我的工作场所,我们有不lessExchange服务器和支持域控制器,目前全部由SCOM监控。 我已经在ASP.net网站上设置了某些监视元素,并由SQL DB支持。 我热衷于更密切地监视服务器,以便我们能够: Baseline the servers better for historical comparison If a problem occurs we can pull out more raw data. 为此,我想从Perfmon计数器中获取更多的数据。 我知道SCOM可以提取一些Perfmon的数据,但是我们的SCOM的实现是相当大的,pipe理它的人不希望我增加计数器的频率,经常足以使其有用。 同时查询SCOM数据库意味着我不能真正改变索引,控制我需要的数据的截断时间,或者真正控制我可能需要的数据。 我的问题实际上是我应该如何处理这个事情的另一个问题,而不是我如何实际拉取数据并插入数据,因为我已经有可以将数据提取并插入到SQL中的脚本。 松散地我们有服务器拆分如下: Exchange 2007 in Domain1.com Exchange 2010 in Domain2.com 对于Exchange 2007/2010,服务器按照以下逻辑分割: Mailbox Servers Client Access Servers Hub Transport Servers Domain Controllers 我想从上面的所有服务器中获取计数器的基本信息,然后深入了解特定的服务器types,例如,从邮箱服务器中提取RPC平均延迟,来自CAS服务器的连接数,提交的消息数/秒HT服务器等 所以我想要做的是创build4个脚本types,每个类的服务器,然后运行它们从每个服务器按计划logging一些数据,连接到我的SQL DB,然后将logging插入表。 对于我的SQL表,我应该为每个服务器类创build一个,还是只将所有logging放入一个表中? 在每个在SQL表中抛出所有数据的服务器上运行本地脚本是一个糟糕的主意? 我考虑远程收集数据,但是如果我只想每隔几分钟捕获一些数据,就会发现由networking延迟或其他因素引起的时间差异很大。 我也很想听听任何潜在的存档解决scheme,比如最近几天如何保持更频繁的logging(也许每隔5分钟为所有柜台5天),但保持较less的logging回溯到时间。
我有几台运行应用程序的计算机。 这些计算机在互联网上,可以通过端口80连接到一般的互联网。这些计算机具有通过DHCP分配的dynamicIP地址。 这些计算机安装在几乎不能控制networking的环境中。 我想安装在每台计算机上运行的运行性能副驾驶 (PCP)来logging系统和应用指标。 PCP电话可以从所描述的环境转到中央监控系统,在那里我可以汇总数据以进行可视化和分析? 中央监控系统可以在一个静态IP地址,我可以完全控制这个networking环境。 但是,由于其dynamicIP地址,服务器不可能接触到客户端计算机。 每个客户端计算机的统计信息可以通过唯一的客户端variables或MAC地址来标识,而不是通过IP地址或DNS条目来标识。 这是应该用不同的工具来完成吗? (Zabbix,Sensu) TLDR:可以将PCP性能统计从客户端推送到服务器,还是服务器必须从静态IP或DNS条目请求PCP统计信息?
目前有一个客户说,在2cpu,4GB的应用程序服务器上的5个用户正在经历缓慢,并经常locking片段的时刻。 框架是在vSphere 5.5(基于Intel的主机,最近从AMD主机迁移),Server 2008 r2,Citrix 6.5,使用Receiver 4.2的本地机器上运行的VM。 我已经提高了CPU,这只会提高CPU的性能,使性能变差。 内存增加到8Gb,但虚拟机目前坐在3.8Gb内存使用高原一天,所以没有任何帮助。 更新citrix汇总5,Windows更新,通过事件日志倒入,我已经撞到墙去哪里。 目前正在开发一个性能监视器,将其变成一个数据收集组,并且想知道为了进行典型的“citrix缓慢”调查,将包括哪些“必须”的计数器。 Counters: Citrix MetaFrame Pesentation Server – Cumulative Server Load ICA Session – Latency – Session average Memory – Pages/Sec Paging File – % Usage 还有什么人会build议我把这个东西放进去,这样可以让我得到任何我可以戴上帽子的东西,并继续向前走? 谢谢。
我正在尝试使用性能监视器来监视Win2k8 R2服务器上的总CPU使用情况。 我在12核心系统上运行在HyperV虚拟机上,但是只有一个超线程核心被分配到这个镜像(所以从操作系统的angular度来看有两个CPU)。 我正在查看“当前活动”的“报告”视图,报告显示以下数据点: 处理器(_Total)\%空闲时间 处理器(_Total)\处理器时间百分比 处理器(_Total)\'处理器时间百分比\'定期跳到15% – 30%之间的值,然后回落到“—”,然后回到“0.000”,即使服务器显然闲置。 然而,处理器(_Total)\'空闲时间'保持在100.00或接近100.00的时间,'%Processor Time'值在跳转,但是如果我做了一些我知道产生负载就像运行一些SQL查询。 这导致我相信“空闲时间百分比”是比“处理器时间百分比”更真实的CPU负载的“可靠”度量,但经过大量的search后,我不知道为什么会这样? 现在真正奇怪的是,如果我把“处理器信息(0,_Total)\%空闲时间”添加到相同的报告中,“处理器(_Total)\%处理器时间”和“处理器(_Total)\%空闲时间”突然开始显示一致且可信的数据,而“处理器信息(0,_Total)\%空闲时间”值以奇怪的方式跳转,甚至显示值> 100%。 对不起,这个啰嗦的问题……这真是奇怪的行为,有没有人见过呢?
我有6台机器: 2个Windows 7 32位(W71,W72) 4 x Windows 2008 R2 64位(W2k81,W2k82,W2k83,W2k84) 我想从W7机器上远程访问W2k8机器的性能监视器。 这只是一个testing环境,所以: 机器不在一个域中,但它们都属于同一个工作组 他们都有一个与团体成员同名的帐户: pipe理员 性能日志用户 性能监视器用户 所有防火墙已closures 在W2k8机器上确认以下服务正在运行: 远程registry 性能日志和警报 性能计数器DLL主机 远程过程调用(RPC) 我可以从W71远程连接到W72的性能监视器,反之亦然。 但是,没有计算机可以远程连接到任何W2k8计算机的性能监视器。 编辑:我忘了提及,远程连接到性能监视器时得到的错误是: 尝试连接到远程计算机时发生以下系统错误: 没有这样的接口支持 进一步编辑:我试图访问远程计算机通过右键单击性能 > 连接到另一台计算机上…并提供远程计算机的IP地址: 我接受任何build议。 可能的解决scheme:显然,我可以不像上面描述的那样访问远程计算机的计数器,而是通过在添加新计数器时指定远程计算机的IP地址(或名称):
我正在使用WMI来监视Windows Server 2003和Windows Server 2008主机。 我得到了所有我想要的信息,但磁盘I / O性能。 我试过为“AvgDiskQueueLength”查询“Win32_PerfFormattedData_PerfDisk_LogicalDisk”,但我总是得到“没有密钥”的结果。 WMI服务正在两个系统上运行,我可以使用wbemtest连接到它,没有任何错误。 我错过了什么,或者我做错了什么?
我们在办公室的windows server 2008 R2文件服务器上遇到了很多性能问题。 我们一直在努力查明这个问题,但不能解决问题。 我们有4台虚拟机在VMWare服务器上运行server 2008 r2。 我们有两个物理主机,并使用Netgear ReadyNAS(我们是一个小企业)来保存虚拟机。 直到去年年底,我们开始注意到我们的shadowprotect备份运行在3-4MB / s而不是40-60 + MB / s。 我们已经尝试了很多不同的东西,并且在确定问题的时候遇到了麻烦,因为有时候服务器运行的很好(通常只是在我们重新启动之后),但是随机的话它会再次开始变慢。 我们已经尝试将其移到不同的主机/ NAS(我们也尝试了一个戴尔NAS),但似乎没有任何永久性的帮助。 现在,我的文件副本以6MB / s的速度连接到服务器。 同一台NAS上的另一台虚拟机的运行速度为40-50MB / s。 我们最近重build了虚拟机来尝试修复它,但没有去。 我感觉networking上的某些东西很难打到服务器上,可能使用的文件服务器过于庞大(我们使用Revit和AutoCAD,这可能是networking密集型的),或者其他stream氓开始颠覆它。 我的问题是,我怎么诊断这个? 当我运行性能监视器来查看常用文件时,我们的CPU会经过屋顶(从“系统”的使用情况来看,它已经占用了50%),所以我们不能长时间运行它。 我尝试过程监视器,但很难筛选。 我只是想知道什么networkingstream量造成最大的磁盘/networking负载,我怎么能监控这个? 你有什么其他的build议吗(除了购买一个SAN,我要求一个,被拒绝…) 我们的文件服务器也是一个备份DC,可以影响任何东西吗?
我正在寻找一个工具来显示性能监视器计数器的数据。 我正在寻找一些看起来很吸引人的东西(看起来像一个仪表板),它应该能够汇总(总结)在多个计数器。 没有阈值/警报需要,我们正在使用Nagios的。