今天我在Linux Ubuntu 12.04.5 LTS服务器上进行了apt-get update && apt-get upgrade 。 一切都很好。 四个小时后,监控工具提醒我磁盘I / O过载。 在8核心系统上,I / O等待已达到10-40%,系统平均负载从1增加到20。 网站变得非常缓慢。 看起来硬盘和硬盘不好,但我不太确定。 我应该在哪里挖? 任何帮助赞赏。 uname -a : Linux p-de-www 3.2.0-77-generic #114-Ubuntu SMP Tue Mar 10 17:26:03 UTC 2015 x86_64 x86_64 x86_64 GNU/Linux 最佳: top – 16:19:59 up 1:38, 3 users, load average: 11.54, 7.46, 5.76 Tasks: 217 total, 1 […]
我注意到两周前性能下降,影响了我们的一个SQL Azure后端应用程序。 它在90%的时间内在第一层的V12上运行,有时会扩展到S2,S3或P1。 基本上我遇到了显着较慢的查询执行时间,特别是在INSERT查询。 所以我testing和基准testing和基准testing,然后testing和基准更多。 随着每一步,我都试图把不确定的因素排除在外。 原来,自从我们搬到了V12之后,S1的performance比以前慢了很多。 我最终想出的是很容易重现的:在Azure门户中创build两个新的Sample数据库(Adventureworks_LT)。 一个在新的v12服务器上,另一个在新的V11服务器上。 S1级。 然后在两者上运行我的基准(sorting): DECLARE @start_time DATETIME, @end_time DATETIME SET @start_time = CURRENT_TIMESTAMP DECLARE @cnt INT = 0; DECLARE @until INT = 100; DECLARE @timeNow DATETIME; WHILE @cnt < @until BEGIN Set @timeNow = CURRENT_TIMESTAMP; INSERT INTO dbo.ErrorLog ( ErrorTime, UserName, ErrorNumber, ErrorMessage ) VALUES ( @timeNow, 'BENCHMARK', […]
我正在将数据迁移到LUKS分区。 现在操作系统驱动器运行LUKS,我试图开始迁移数据驱动器。 然后服务器停止响应。 此LUKS设备已打开: cryptsetup luksOpen /dev/sdc data1 而这些命令中的任何一个都会扼杀服务器: pv /dev/zero > /dev/mapper/data1 pv /dev/zero > /dev/sdc 不是马上,但在几秒钟内,服务器变得非常慢。 在I / O上阻塞的所有东西: root@node51 [~]# ps aux | awk '{if($8~"D"||$8=="STAT"){print $0}}' USER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND root 1197 0.0 0.0 0 0 ? D 06:39 0:00 [jbd2/dm-1-8] root 1687 0.1 0.0 […]
我正在使用相同数量的内存和cpus在运行Oracle Linux 6.6(Kernel 2.6)和6.7(Kernel 3.8)的VMWare虚拟机上search一些性能问题。 这些机器通过NFS4挂载相同的共享,其中包含使用LD_LIBRARY_PATH生成的一些共享库。 两个系统都使用相同的安装选项(默认),这对于6.7来说显然意味着“硬”,对于6.6来说意味着“软”。 从6.7开始,我们观察到编译过程的性能下降了5倍,而CPU闲置在80%左右,但也没有观察到高的等待时间(最高报告〜0.4%wa)。 试图重现这个问题,我很快就发现,不仅编译而且几乎所有的命令,比如“ls”,只要通过LD_LIBRARY_PATH包含来自NFS挂载的共享库,6.7就慢得多。 我用一个简单的“时间”开始了我的调查: 在6.6上:没有设置LD_LIBRARY_PATH和PATH: $ time for i in $(seq 0 1000); do ls done; … ls output real 0m2.917s user 0m0.288s sys 0m1.012s LD_LIBRARY_PATH和PATH被设置为包含NFS上的目录 $ time for i in $(seq 0 1000); do ls done; … ls output real 0m2.766s user 0m0.184s sys 0m1.051s 在6.7没有LD_LIBRARY_PATH $ time […]
提前:抱歉的问题的长度…无法在细节和简洁之间取得适当的平衡。 在我们的Web应用程序中,我们遇到了数据库服务器的问题,应该(通常是)在很短的时间(<10ms)内运行的查询,在随机的场合,需要1到30秒的时间执行 – 没有明显的模式。 根据我们的剖析器的轨迹,其中一些甚至是"exec sp_reset_connection" (通常运行在0ms;观察到的峰值为3〜6s)和"SET NO_BROWSETABLE ON"等"SET NO_BROWSETABLE ON"无所事事”查询。 : SELECT * FROM [Localisation].[TimeZoneRule] WHERE [Name] = 'EU' TimeZoneRule在5列中有大约500,000行。 具有代理主键和Name上的索引。 通常需要0.97ms,在11s达到峰值。 表从未写入(在上线之前预先填充)。 事件探查器logging为0-15 CPU,18-25读,0-1写(不知道为什么写)。 UPDATE [Core].[User] SET [LastUsed] = GETUTCDATE() WHERE Id = '<uid>' User在大约10列(其中之一是Xml列)上有大约30,000行。 Id是集群主键。 表是定期写入和读取。 通常需要10〜20ms,峰值在26s。 Profiler将其logging为0 CPU,15-36次读取,0-1次写入。 INSERT INTO [Log].[Session] (ASPSessionId, Start, ClientAddress, ClientSoftware, ProxyAddress, ProxySoftware) VALUES(<number>, GETUTCDATE(), '<ipv4address>', '<User […]
sql servr 2005 – Standard; 一个专用的sql服务器(VM); windows server 2003; 小型数据库; 大约每周一次,我们失去了所有的sql连接。 大约5-10分钟后,似乎会自行修复。 System.Web.HttpUnhandledException:抛出了types'System.Web.HttpUnhandledException'的exception。 —> System.Data.SqlClient.SqlException:超时过期。 操作完成之前超时的时间或服务器没有响应 。 我们没有一个完全合格的DBA; 这是一种共同的努力。 有人可以给我一些一般的想法来解决networking端和应用程序端? 我们已经运行了一些调优configuration文件,并通过数据库调优顾问来运行索引build议。 如果有一种方法可以快速logging在sql server上运行的这些100%cpu峰值的情况,那肯定会很好,但是有时我们不在身边。 调节某些进程的CPU是否很常见? 这可以用Windows Server 2003来完成吗? 例如,如果安全性应用程序正在使CPU达到100%,是否有办法限制它们的CPU使用率? 任何意见表示赞赏。 谢谢,
有一篇关于linux-mag的文章,指出增加ext4文件系统日志的大小实际上可以提高非常大的分区的文件系统性能。 我想知道这里有没有人可以对我进行权威性的确认或否认。 我只是自己testing一下,但目前我没有任何备用硬盘来重新格式化。 人们告诉我这是真的,其他人告诉我不是。 它确实对我有一定的意义,显然,一个5TB的分区将比500GB的分区有更多的元数据,但是对于这两个分区,默认的日志大小都是128MB,所以可能增加更大的日志大小分区实际上可能会有某种影响。 很明显,我们谈论的只是一个非常小的性能增益,只能通过正常用户永远不会遇到的那种繁重的系统活动来衡量,比如渲染农场或数据库服务器,但是仍然可以find这个问题的答案对我来说很重要。
有没有人有一个想法如何有效的Windows事件日志是? 我有一个场景,每分钟可以logging许多事件。 Windows事件日志是否被很好的处理了大量的事件? 例如就性能而言,它会与SQL Server相媲美吗? 最后是可以使日志到数据库?
我有一个Linux(CentOS 5.6)VPS,我用它来托pipe一些不重要的项目,但是我现在真的在性能上苦苦挣扎。 我能做些什么来确定问题是我的configuration,还是我的主机超载了我所在的服务器? 如果我现在ping服务器: Ping statistics for xxxx: Packets: Sent = 100, Received = 73, Lost = 27 (27% loss), Approximate round trip times in milli-seconds: Minimum = 161ms, Maximum = 207ms, Average = 167ms 服务器上的网站加载非常缓慢。 我可以通过SSH连接,但是我按下键盘和屏幕上出现的任何东西之间有2-20秒的延迟。 负载很低(0.18(1分钟)0.15(5分钟)0.09(15分钟)),内存使用率低,networking接口很难被使用…我在下面列出了一些进一步的信息。 # vmstat procs ———–memory———- —swap– —–io—- –system– —–cpu—— rb swpd free buff cache si so bi bo […]
我在其中一台服务器上看到了非常奇怪的性能特征。 此服务器正在运行简单的双磁盘软件-RAID1设置,LVM跨越/dev/md0 。 其中一个逻辑卷/dev/vg0/secure使用带有LUKS的dmcrypt进行encryption,并使用sync和noatimes标志进行挂载。 写入该卷的速度非常慢,速度为1.8 MB / s,CPU使用率接近0%。 有8个crpyto/1-8进程正在运行(这是一个Intel Quadcore CPU)。 我希望serverfault上的某个人在之前看过这个:-(。 uname -a 2.6.32-5-xen-amd64 #1 SMP Tue Mar 8 00:01:30 UTC 2011 x86_64 GNU/Linux 有趣的是,当我从设备上读取我获得良好的性能数字: 没有encryption的阅读: $ dd if=/dev/vg0/secure of=/dev/null bs=64k count=100000 100000+0 records in 100000+0 records out 6553600000 bytes (6.6 GB) copied, 68.8951 s, 95.1 MB/s 读取encryption: $ dd if=/dev/mapper/secure of=/dev/null bs=64k count=100000 […]