我有一个文件服务器(6.3),今天突然放缓。 挂载它的集群可以毫无问题地访问其他NFS挂载,但访问这个非常慢。 通过sshlogin也非常慢(idrac虚拟控制台没有信号 – 也许是一个不同的问题)。 在服务器上运行iostat -x 5并没有显示任何问题。 'await'大部分是0,有时达到2,%util大部分是0,有时达到3,很less是5.据我所知,这表明没有明显的io问题? 在服务器上运行显示,除了CPL平均值在14-17范围之外,没有什么特别的,而在30分钟内CPU使用率始终在3200%的100-200%之间,的东西。 在输出之下。 一个关于CPL的问题可能与此有关:系统是超线程的,因此当有16个物理内核(2×8)时显示32个CPU。 CPL仅适用于物理内核,还是适用于超线程虚拟内核(如果是这个术语)? 14-17的CPL应该罚款,如果后者,而不是前者。 但无论哪种情况,我都不明白为什么CPL看起来和CPU不一样。 感谢您的任何想法。 PRC | sys 10.70s | user 0.18s | #proc 2846 | #tslpu 9 | #zombie 0 | #exit 6 | CPU | sys 107% | user 2% | irq 0% | idle 3094% | wait 0% | curscal ?% […]
我有一堆旧的LTO-2磁带,我的任务是将内容保存为磁盘上的大二进制文件,以便最终整合到较新的介质上。 (内容是特定于本网站的自定义格式,与此问题无关,我不需要保留阻止。) 我想就如何尽快阅读内容提供一些build议。 使用dd当前性能大约是2MB / s,我相信这是由于磁带上文件的低和可变的块大小。 LTO-2规格说我应该能够获得本地40MB / s。 使用Solaris,我可以看到与tcopy实用程序的文件存储在一个可变的块大小: # tcopy /dev/rmt/1cbn file 1: record 1: size 40 file 1: record 2: size 1024 file 1: record 3: size 10240 file 1: record 4: size 7168 file 1: record 5: size 1024 file 1: records 6 to 7: size 10240 […] testing从磁带读取到/dev/null : # […]
我在Apacheconfiguration8gb的RAM 1and1.com虚拟服务器上遇到服务器超载的问题。 服务器一旦达到100多个活跃用户(根据谷歌分析)在select时间变得非常缓慢。 我已经完成了包围和loadimpacttesting,并对httpd.conf文件进行了一些configuration更改,但是我不知道是否足够。 也许我只需要更多像16GB的内存或我错过了什么? 我知道我可以优化编程,但我不明白它将如何大幅度提高性能。 有趣的是,在过载期间,并行内存使用率只显示10-20%,但网站太慢了! 帮帮我! Avg. site file size is 1.5MB (We have lots of pictures) Avg. load time: 1.8s (during normal days) – 1,600 page views, 270 highest sessions p/h 这是一个非常缓慢的服务器日的分析统计: Highest sessions per hour: 420 – 700 Total sessions: 4,300 – 37,000 Page views: 25,300 – 361,500 Avg. Session duration: […]
我被要求在一个客户的设施中排除托pipe我们应用程序的服务器的故障。 客户在上周一周半的时间里曾两次向我们投诉。 在一个例子中,他们声称服务器的内存是“最大化”的,而在另一个例子中,他们声称CPU是“最大化”的。 在这两种情况下我们的应用程序变得不可用,客户端被迫重启服务器。 服务器规格如下: System Manufacturer Dell Inc. System Model PowerEdge R320 System Type x64-based PC Processor Intel(R) Xeon(R) CPU E5-2430 0 @ 2.20GHz, 2200 Mhz, 6 Core(s), 12 Logical Processor(s) – Hyperthreading-enabled??? OS Name Microsoft Windows Server 2008 R2 Standard Version 6.1.7601 Service Pack 1 Build 7601 Installed Physical Memory (RAM) 32.0 GB […]
引用RedHat性能调优指南 3.3.7。 设置中断关联 中断请求具有相关的亲和属性smp_affinity,该属性定义将处理中断请求的处理器。 要提高应用程序性能,请将中断关联和进程关联分配给同一个处理器或同一内核上的处理器。 这允许指定的中断和应用程序线程共享caching行。 我有一个应用程序接收和处理大量的UDP数据。 如果我想缩短UDP数据包到达应用程序和完成数据包处理之间的时间,我应该为接收数据包和应用程序的NIC分配相同的亲和力吗? 或者我应该给他们不同的亲和力? 我觉得上面提到的前者有这样的说法,但是我会认为后者可能会更有益处。 任何帮助将是伟大的。 谢谢
我在Google Page Speed上testing了我的网站的性能,并提到了我的网站的响应时间 它平均在.6-.8秒之间。 什么是最佳的服务器响应时间是可以接受的? 有没有关于这方面的performance最好的数据或研究? 编辑:我说这个问题的方式有点混乱。 为了澄清,我不是在谈论页面加载,而是浏览器从服务器接收KB或MB或数据所花费的时间。 当pagespeed说.6秒慢时,有一个他们所指的基准。 不幸的是,我无法理解这一点。
当进行一些性能testing,写入由mdadm驱动的基于SSD的3路RAID 1镜像时,似乎我们遭受的写入惩罚比在单个驱动器上进行相同的testing要慢大约2.2倍。 我们在这个testing中正在阅读和写入相同的底层物理驱动器,因为它模拟了我们感兴趣的真实世界testing案例。 由于SATA III速度限制或其他原因,这是否会减速? 我很惊讶RAID 1会有写入惩罚,因为我认为它可以写入所有三个驱动器同时写入其中一个相同的速度。 All three drives present: dd if=/dev/md3 of=test.file bs=1048576 count=37193 …207.748 s, 188 MB/s Just two drives present (ie normal two-drive RAID 1) dd if=/dev/zero of=test.file bs=1048576 count=37193 …119.016 s, 328 MB/s Just one drive present (no redundancy) dd if=/dev/zero of=test.file bs=1048576 count=37193 …93.794 s, 416 MB/s
我正在testing我的VPS服务器的响应时间: curl -s -w %{time_total}\\n -o /dev/null http://www.example.com 这个值通常是300ms,Googlebuild议它应该低于200。 看起来这不取决于使用的CMS,与Wordpress和其他平台相同。 几乎没有包括简单的PHP页面有价值圆175。 也许这是一些Apache或DNSconfiguration错误? 你将如何debugging,看看如何提高响应时间?
当用top监视我的系统时,我注意到在RES下有些值有一个't'后缀,但是我看不到有什么意思。 PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND 37393 libvirt+ 20 0 15.100g 0.012t 4992 S 105.5 9.7 151:05.32 qemu-system-x86 42545 libvirt+ 20 0 15.433g 0.012t 4984 S 96.2 9.8 189:08.01 qemu-system-x86 6191 ceilome+ 20 0 199236 35632 4432 S 13.6 0.0 687:02.55 ceilometer-agen 6198 nova 20 0 4934088 366448 […]
我一直在解决一个间歇性的服务器性能问题太久,我没有想法。 我正在寻找任何build议,以便我能够找出问题的原因。 我们(我的团队)在几年前为客户开发了一个使用SQL Server数据库的客户端/服务器Windows Forms应用程序。 客户最近开始遇到一些性能问题,并决定升级其基础架构。 他们从一台物理SBS机器迁移到有多台虚拟机的虚拟环境。 我们成功地将应用程序和SQL位移植到了新环境中。 然后,客户端请求应用程序更新以修复多年来一直运行的内存泄漏和其他性能问题/错误。 我们在我们的环境中做了更新和系统平台。 然后,我们部署到他们新的生产环境,系统似乎运行良好。 在部署后的一两天,我们收到有关系统挂起或滞后的抱怨,当加载/保存表格数据或生成报告时。 我们远程与客户端连接并确认问题。 我们分析了客户端环境并检查了可能的内存泄漏以及可能导致症状的其他问题。 我们没有发现。 然后我们意识到性能问题影响到networking上的多台机器,并且必须是环境的。 然后客户有他们的硬件支持技术人员排除潜在的硬件/networkingconfiguration的来源。 他们没有发现。 在我们与客户进行的几轮故障排查中,我们偶然发现了纠正性能问题的方法(这似乎是随机的)。 服务器重新启动修复了这个问题,但这不是一个可接受的修复方法。 另一种方式,也是我发布这个的原因是,当客户端注意到性能下降时,他们可以打开应用程序的“传统”版本(在某些客户端机器上仍然可用),性能得到恢复。 现有的客户端应用程序实例重新启动是不需要的。 这个系统在事件之间performance良好,这个问题似乎平均每2到3天就会发生一次,但是一个星期内无事故发生,并且在一天内也有多起事件(早上一次,然后一次这个下午)。 我们认为这个问题可能是一个SQL Server问题。 所以我一直在分析,保存痕迹,并一直在监视SQL性能计数器寻找线索。 我不是SQL性能专家,所以我可能不会考虑正确的计数器,但SQL Server似乎并没有被推得很辛苦。 CPU,内存,批次/秒,事务/秒,编译/秒,重新编译/秒,并且寻呼和caching计数器通常是静态的。 应用程序可能一次运行10到20个活动实例。 应用程序最初并不是用最有效的数据检索实践编写的,但是生成的负载不是服务器无法处理的。 我也一直在监视Windows事件日志中的错误和警告,可能会发现问题的一些亮点,但没有看到任何事件之前或事件中指出的问题。 我们发现的另一个奇怪的观察是,无论系统整体性能如何,直接在服务器上执行应用程序时,应用程序都不会降级 当其他机器遇到问题时,我已经直接在服务器上运行应用程序,没有缓慢或滞后。 对不起,这本书。 我将继续挖掘线索,但任何build议将不胜感激。 服务器:Windows Server 2012 R2(分配大量资源的虚拟机)SQL:SQL Server 2014标准客户端:混合但大部分为Windows 7 Professional