Articles of 性能

执行fio时CPU时间较长的原因

经过几个星期的解决我的VPS运行Ubuntu 12.04 LTS的性能问题,我越来越接近这个问题与IO有关的结论。 当我有相当多的文件需要访问时,CPU高达100%。 但是,没有IOWAIT,所以似乎由于某种原因,CPU不能应付。 使用fio做一个随机读取testing,我设法收集这个输出。 在其他机器上(例如我的个人Ubuntu),我注意到CPU完成相同testing的时间远远低于一小部分。 时间低于正常水平吗? 如果不是可能是什么原因? 与本机磁盘访问相比,虚拟化过程是否会过度征税CPU? random-read: (g=0): rw=randread, bs=4K-4K/4K-4K, ioengine=sync, iodepth=1 fio 1.59 Starting 1 process random-read: Laying out IO file(s) (1 file(s) / 128MB) Jobs: 1 (f=1): [r] [100.0% done] [12185K/0K /s] [2975 /0 iops] [eta 00m:00s] random-read: (groupid=0, jobs=1): err= 0: pid=24264 read : io=131072KB, bw=10298KB/s, iops=2574 , […]

Infiniband链接是DDR HCA的4倍SDR; 有没有人见过这个?

我最近将Infiniband HCA从SDR升级到了DDR,但升级后根本没有提高链路速度。 从“iblinkinfo”接收以下输出: CA: ip-san-1-au3a mthca0: 0x0008f104039812b5 3 1[ ] ==( 4X 2.5 Gbps Active/ LinkUp)==> 4 1[ ] "sp-vmh-1a-au3a mthca0" ( Could be 5.0 Gbps) CA: sp-vmh-1a-au3a mthca0: 0x0008f10403981435 4 1[ ] ==( 4X 2.5 Gbps Active/ LinkUp)==> 3 1[ ] "ip-san-1-au3a mthca0" ( Could be 5.0 Gbps) 我search了一些答案,但无法接近解决这个问题。 有没有人见过这个问题? 我正在使用Belkin CX4 10M电缆将两台服务器连接在一起,显然能够支持SDR / […]

mdadm raid10或nfs的性能问题?

我有一个新的mdadm RAID10设备是健康的,由4个7200转/分钟的SATA 3驱动器构build而成: # cat /proc/mdstat Personalities : [raid10] [raid1] md2 : active raid10 sdc3[5] sda3[4] sdb3[1] sdd3[3] 3885267968 blocks super 1.2 512K chunks 2 near-copies [4/4] [UUUU] (还有两个mdadm设备,但是md2是相关的) 在md2之上是一个ext4文件系统,用以下方式创build: mkfs.ext4 -m0 -L bups -b 4096 -E stride=8,stripe-width=32 /dev/md2 在通过NFS使用它作为备份目标时,性能非常糟糕。 在单个客户端写作时,我看到了这样的数字,大约有30%到50%的I / O等待在top : Device: tps MB_read/s MB_wrtn/s MB_read MB_wrtn sda 197.00 0.00 1.07 0 […]

为什么在sar -B中pgpgin / s和majflt / s不一致?

在sar -B pgpgin/s ,我会天真地期望pgpgin/s等于majflt/s乘以系统页面大小。 从man sar : pgpgin/s Total number of kilobytes the system paged in from disk per second. Note: With old kernels (2.2.x) this value is a number of blocks per second (and not kilobytes). majflt/s Number of major faults the system has made per second, those which have required loading a memory […]

为什么WHM,New Relic和SSH内存使用统计不一样?

我有一个Cent OS 6.4 Apache Nginx VPS。 我有WHM cpanel。 如何检查过去的24小时或48小时内的服务器内存使用情况? 我使用新的文物服务器监视器Web应用程序。 据报道,这个VPS高峰时间的RAM使用率不到30%。 此外,WHM服务状态显示类似的数字。 但是当我联系我的VPS公司时,他们提到,它使用超过95%的RAM(高峰时间)。 我对服务器pipe理完全陌生。 更新! 当我运行free -m命令,我收到以下输出。 但与此同时,WHM cPanel服务状态显示,内存使用率为16.88%(2621,440)中的442,464。 也有新的文物显示类似的统计(类似于WHM)。 root@host [~]# free -m total used free shared buffers cached Mem: 2560 1117 1442 0 0 748 -/+ buffers/cache: 368 2191 Swap: 0 0 0 root@host [~]#

如何debugging呆滞的进程性能

我有一个testing应用程序,它将一个string写入一个文件10000次。 我在两台服务器上运行这个,我得到完全不同的结果。 [SYSTEM 1] $ time ./test_depth real 0m0.152s user 0m0.070s sys 0m0.082s $ strace -cT ./test_depth % time seconds usecs/call calls errors syscall —— ———– ———– ——— ——— —————- 57.38 0.000420 0 10000 write 30.19 0.000221 0 9924 fadvise64 12.43 0.000091 0 10000 gettid 0.00 0.000000 0 11 read 0.00 0.000000 0 66 54 […]

惠普智能arraysP822 w。 双D2700 – 布线性能最佳

阅读“D2600 / D2700用户指南”,有一节叫做“Cabling examples”,但没有一个例子符合我们打算的要求。 我们只是想确保它在我们做之前是有道理的。 所以这是计划: 我们在Gen8机架式服务器和2xD2700机箱中安装了1xP822。 每个D2700有24个驱动器。 D2700configuration了完全相同的磁盘布局。 我们在D2700机箱顶部创build一个RAID10arrays(意思是每个D2700机箱都有一面镜子,HP ACU / SSM会自动确认这一点)。 然后,我们将P822控制器总共连接4根电缆连接到D2700机箱(无级联): P822端口1E:D2700盒1,IO模块A P822端口2E:D2700盒2,IO模块A P822端口3E:D2700盒1,IO模块B P822端口4E:D2700盒2,IO模块B 在这里不考虑扩展选项,就从驱动器/机箱/ p822控制器获得最高性能而言,这是否是正确的布线方式? 谢谢 :) 编辑:所以我从目前的意见看,是这种方法是不是“错/不正确”,这只是没有任何真正的好处?…

实际的磁盘iops和写入合并

/ dev / sdb具有LVM并公开单个逻辑卷dm-0。 在写入dm-0时,/ proc / diskstats报告: # of writes completed sdb 29646717 dm-0 131315099 # of writes merged: sdb 101668283 dm-0 0 这意味着/ dev / sdb统计报告已经合并了大部分写入,所以报告的写入总量要低得多,而lvm设备却没有。 哪些计数器更能反映较低层检测到的实际写入IOPS(例如AWS提供的IOPS?)

Azurevariables表v临时表

这有点长; 但是我一直在通过查询来找出性能问题的来源。 感谢您花时间阅读。 我有一个运行在运行SQL Server 2012 @ Azure的专用服务器上的应用程序(西欧,如果有的话)。由于Azuresql中的function差距,我的应用程序不能在共享服务上运行。 过去运行的应用程序已经在各种2012服务器上运行,而且我注意到Azure和其他非Azure sql服务器之间奇怪的性能exception。 这个问题是围绕临时表 – 再次variables表v#表。 我们在Azure上发现,variables表的查询持续时间相当长; 很简单的例子; 每次运行50次并取平均值。 Create table #table (contactid uniqueidentifier, AnotherID uniqueidentifier) insert into #table select top 100 contactid, AnotherID from dbo.pdContacts v declare @table table (contactid uniqueidentifier, AnotherID uniqueidentifier) insert into @table select top 100 contactid, AnotherID from dbo.pdContacts Profiler说统计平均在; Variable Table : […]

“诺西邻居”和CFQ调度

我想了解如何使用CFQ影响“讨厌的邻居”问题。 我会问这个问题,使用CFQ的时候,是否还会有一个“好邻居”? 是不是CFQ应该确保所有进程(VM)获得公平的存储时间片? 如果是这样,当CFQ被使用时,一个VM I / O如何干扰另一个VM I / O? 环境是CentOS6.5 + OpenStack + KVM + Ceph