Articles of 高性能的

CPU /内核比率的性能影响

随着最近广泛采用多核CPU,人们就会想到一个问题:CPU /内核的性能如何与性能相关联? 哪一个更好,如何以及为什么? 1个8核CPU 2个4核CPU 4个2核CPU 我已经知道许可的含义(有些软件在物理CPU上许可,而不pipe实际的内核是什么,其他的则是实际上关心这个),当然,具有更多物理CPUsockets的系统是更加可定制的,并且可以更容易地扩展; 但我感兴趣的是这些configuration之间的性能差异…如果有的话。

关于networking附加存储(NAS)和CPU速度的一些考虑

(我希望我的问题不是太琐碎…) 我将select一个NAS设备,我正在寻找一个专业的NAS模型。 为了select正确的模式,我记住了networking速度,磁盘容量,冗余解决scheme(RAID)等。现在,我想到一个问题:CPU的速度和networking适配器之间是否存在关联? 我的意思是,如果我有两个型号的NAS,使用相同的磁盘,相同的networking适配器速度,但速度不同的CPU,在具有更高CPU的NAS上性能会更高。 谢谢。 DMC

关于巨大的页面和翻译旁视缓冲区

他们混淆了我。 巨大的页面:pipe理OS内核的物理内存的方式,为了减less页表中的索引号,它被内核拆分成大页面。 我从它得到: https : //stackoverflow.com/questions/1973473/difference-between-cache-and-translation-lookaside-buffertlb 翻译旁视缓冲区:翻译旁视缓冲区(TLB)是内存pipe理硬件用于提高虚拟地址转换速度的CPUcaching。 巨大的页面(OS级别)翻译后备缓冲区(CPUcaching) https://www.kernel.org/doc/Documentation/vm/hugetlbpage.txt文件说,/ proc / sys / vm / nr_hugepages指出了当前内核巨大页面池中的“持久”巨大页面的数量。 在我的服务器上, echo 40 > /proc/sys/vm/nr_hugepages cat /proc/meminfo | grep -i hugepage AnonHugePages: 1675264 kB HugePages_Total: 40 HugePages_Free: 40 HugePages_Rsvd: 0 HugePages_Surp: 0 Hugepagesize: 2048 kB 接下来,这是我的问题。 AnonHugePages是什么意思? 为什么是1675264KB? 我认为有40 x 2048KB的巨大页面内存。 我不明白。 为什么我无法修改Hugepagesize? 理论上,内核可以修改大小。 也许只是没有内核的接口。 如何获得翻译旁视缓冲区大小? 我想系统内核知道大小,因为内核会使用它。 我希望我明确expression。 🙂

在Netapp上显示IO

我想我可能会碰到我的Netapp可以提供的IO限制,因为我已经为我的群集添加了更多的服务器,并且iowait已经在每台服务器上运行了。 但是,我怎么量化呢? 我如何使用Netapp CLI工具来查看当前的IO统计信息? 我知道“统计显示”,但没有看到“io”对象或类似的。 我怎么知道Netapp应该能够提供什么? 如果任何人有比Netapp更多的经验,我会非常感谢帮助。 谢谢!

terminal服务器冻结

我只有基本的Windows Server知识,并且已经inheritance了20-30个并发用户(Windows Server 2003)的terminal服务器安装责任。 性能间歇性的问题 – 最终是由于我认为服务器的低规格(使用PAE的三核4Gb内存)。 我试图看看在今年晚些时候进行重大升级之前是否能继续运行。 我注意到的一件事是来自不同会话的进程经常占用100%的内核。 我认为当这种情况一次发生几次会话时会发生冻结。 有什么我可以做的,以限制个人会议的CPU使用? 另外,是否有可能保留一个核心,使其不被个别会话使用,但可用于处理login等?

VMware ESXi主机上可接受的数据存储延迟是多less?

通过数据存储/实时性能数据查看我们现有VMware ESXi 4.1主机上的性能数据 写入延迟 平均14毫秒 最大41毫秒 阅读延迟 平均4.5毫秒 最大12毫秒 人们似乎不太抱怨这些数字太慢了。 但是在人们认为这是一个问题之前,他们能得到多less呢? 由于存储空间不足,我们正在审查总部系统,并且在购买第二台虚拟主机与DAS或在短期内购买某种types的SMB文件共享以及可能从中运行虚拟机术语。 目前我们在总部只有不到40名员工,在全国各地有9个较小的分支机构。 总部运行在基于MS ERP和邮件系统的基于MS RDS会话的环境中。 一台主机上共有22台虚拟机,DAS由6块15k SAS磁盘组成的RAID 10组成。

如何从其他大陆testingWeb应用程序的性能?

我们在位于德国的服务器上托pipe我们的Web应用程序http://timr.com 。 服务器可以很好地处理高负载的stream量,在性能和加载时间方面,所有的工作都可以按照需要进行。 然而,我们有时会收到我们的海外用户(美国,南美)的投诉 ,感觉页面加载速度缓慢。 testing一个Web应用程序性能的最好方法是“如果你在另一个大陆上”? 我想确保服务器和用户之间的距离没有问题?

监视较大(3000设备)networking的硬件要求

我目前正在评估监测软件(按我的标准)一个更大的networking预计将增长到约3000台设备。 我正在find有关硬件需求的数据。 (编辑:设备是由SNMP监视的卫星接收器,因此需要无代理监视器。我们主要关心的是识别故障设备,而且我们不需要大量的分析。) 3000台设备每个将有大约40个数据点,以5到10分钟的周期login。 轮询时间间隔为10分钟,即每分钟12000个点。 这提供了两种负载:轮询应用程序的CPU负载,最重要的是磁盘写入负载来存储这些数据点。 我曾看过Solarwinds Orion,Zenoss,Zabbix和OpenNMS。 我们在几百个设备的小型networking上拥有Zenoss和Orion的经验。 我最初的印象是: Zenoss没有一个非常高效的RRD实现,但是允许我们通过添加收集器(在本地存储RRD数据)进行水平扩展。 Orion允许我们添加轮询引擎,但需要一个共享的SQL服务器来提供性能数据。 Zabbix声称扩大到这个水平,但我还没有find任何有用的指导。 由于它使用性能数据的数据库,所以数据库调优是关键。 由于经过优化的RRD实施和对分组的支持,OpenNMS看起来是性能领先者。 有没有人有经验或性能数据来监测这个networking规模?

VirtualBox在并行运行多个虚拟机时性能下降

在Travis CI( http://travis-ci.org )上,我们使用VirtualBox虚拟机(通过Vagrant)来运行Ruby社区的testing。 在我们的工作服务器上,我们有多达N个并行进程在N个虚拟机中并行运行N个testing套件,即一个工作进程一次在一个虚拟机上运行一个testing套件,但其中N个正在同时运行。 现在,只要许多工作人员实际上并行地执行构build,与在同一个工作人员中运行完全相同的构build(而没有其他任何其他方面并行)相比,每个构build的性能将显着降低。 这里是一个例子: 这个“构buildmatrix”由20个独立的构build组成: http://staging.travis-ci.org/#!/svenfuchs/rails/builds/1906 在运行的时候,有10名工人正在运行,所以这个工作是在10个工人(和VM)并行执行的10个独立工作的基础上开始的。 这个版本就是其中之一,花费了2个小时才完成: [见上面的页面列表中的最后一个链接,我只能发布2个url] 当没有其他构build并行执行时,同样的构build只需要大约20分钟。 这是一个例子: http://staging.travis-ci.org/#!/svenfuchs/rails/builds/1927 显然这种性能下降是我们需要解决的问题,但我们不确定在哪里寻找。 testing套件基本上执行Ruby进程,这些进程可能会掏出并产生几个其他的Ruby进程,每个进程在代码库上执行unit testing。 其中一些命中数据库,如MySQL,Sqlite3和Postgres,但我们也注意到同样的退化testing,根本没有打到任何数据库。 托pipe这些进程和虚拟机的工作服务器如下所示: Linux 2.6.32-31-server#61-Ubuntu SMP周五4月8日19:44:42 UTC 2011 x86_64 GNU / Linux 12x(Hexacore)Intel(R)Core TM i7 CPU 950 @ 3.07GHz 12 GB内存 每个VM: Linux lucid32 2.6.32-28-generic#55-Ubuntu SMP Mon Jan 10 21:21:01 UTC 2011 i686 GNU / Linux 1个Intel(R)Core(TM)i7 CPU […]

多个服务器vs 1大服务器性能

我的开发团队为即将开展的项目提供了一个服务器结构。 我们的结构是“逻辑的”,这意味着应用程序的各种逻辑组件(它是分布式的)依赖于不同的服务器。 有些组件比其他组件更重要,将承受更多的负载。 我们的build议是每个组件有1个服务器,但是硬件人员build议用单个更大的虚拟服务器replace各种机器。 他们会使用刀片服务器。 现在,我不是一个专家,但我的问题是,如果我们需要,例如,3个2GHz的CPU / 2GB RAM的机器,你给我一个机器3个2GHz的CPU和6GB的RAM,是一样的吗? 他们告诉我这是。 这是准确的吗? 这两种解决scheme的优缺点是什么? 什么是普遍接受的最佳实践? 你能指出一些处理这个问题的URL引用吗? 编辑: 一些更多的信息。 (互联网/内联网)应用程序已经分层。 我们在DMZ上有一些服务器,将页面展示给互联网,数据库在自己的机器上。 我们想要分裂(他们想要join)是一些主要暴露web服务的web服务器。 一个是与数据库层进行通信的DAL,一个是我们的单一login/用户configuration文件应用程序,每个页面调用一次,另一个是在互联网上看到的用于我们的lan的克隆。