Articles of 性能

FPM活动进程不断增长

最近,我不得不面对php-fpm问题,不断增加可用的活动进程。 它正在达到max_children,然后重新启动。 该图显示了来自三台服务器的池状态(循环余额)中的“活动进程”值。 configuration: pm.max_children = 100 pm.start_servers = 20 pm.min_spare_servers = 5 pm.max_spare_servers = 35 pm.max_requests = 2000 在凌晨1点,我将configuration更改为: pm.max_children = 500 pm.max_requests = 500 这个池服务约4k的需求/分钟(所有的服务器)。 我必须承认其他游泳池正常工作,相同的设置(最大的池服务〜12k的需求/分钟)。 什么可能是这样的行为的理由?

试图debugging缓慢的远程mysql服务器问题

这是我想要debugging的场景: 我使用PHP的microtime()函数来分析MySQL查询,以确定每个查询需要多长时间。 我已经在一个域上进行了testing,并比较了平均查询时间。 本地和远程服务器上的数据库是相同的。 当网站使用其本地数据库服务器时,查询时间都在预期的0.0002-0.0004秒范围内。 使用远程数据库的平均查询时间是0.0695秒。 从域的服务器到远程数据库的服务器的平均时间平均为0.0068秒(68毫秒)。 这会使每个查询的往返延迟大约为0.0136秒。 这不意味着在远程服务器上的每个查询平均只需要大约0.014秒? 我们平均慢了5倍左右。 请记住,这些都是非常简单的查询与微小的结果集。 跳过名称parsing在my.cnf中打开,并且正在使用远程服务器的IP地址进行连接。 还有什么其他因素可以在这里发挥,我应该看看什么? 我期待更快的查询时间比我所得到的权利吗?

考虑到没有网站/服务是100%,系统如何精确测量networking停机时间?

我认为这个标题本身就是很有说服力的。 但是,举个例子:在最近的一篇文章中,有37个信号显示它是真正的停机时间,并与其他Web服务相比较。 停机时间很less,可能大多数公司都没有。 但是,要衡量所有你需要一个100%正常运行时间的子弹教授系统,或至less某种启发式来模拟。 在这种情况下,他们使用Pingdom ,但任何其他类似的服务应该能够模仿。 那么,他们如何做到这一点? 他们是否会让2或3台服务器抓取数据,并做和平均,而不考虑自己的停机时间? 这是微不足道的还是复杂的? Ps .:对于“精确度”的更好的定义是在没有错误的情况下进行测量,或者不会错过任何停机时间。 所以,如果服务停止,你知道,100%的时间。 否则,你可能会有一个有偏见的措施。

监控Apache Solr实例的最佳度量标准

我们正在通过太阳黑子运行Apache Solr。 根据需要进行聚类/缩放,用什么最好的度量来观察solr的性能? 我正在用nagios或者sensu来监视这些事情,并计划每秒钟绘制请求和响应时间,然后apache检查它,看看哪里出了问题。 有什么具体的价值我应该看看或最好的实践监测? 我已经看到了一些关于使用JMX进行监视的文章,但是我不认为我可以使用太阳黑子进行启用,并且大部分的nagios插件似乎只是监视它的响应时间,而不是性能数据。

Samba目录下的一个文件夹突然很慢,现在这个文件夹中包含了超过2tb的文件

我有一台运行Debian stable的服务器,在这台服务器上我保存了我的电影档案。 自从我安装它以来,它在过去的6-9个月里performance相当不错,但在过去的几天中,为我的Windows桌面提供了其中一个samba共享目录列表的电影目录非常缓慢 – 但它不会影响共享上的其他任何文件夹。 有问题的文件夹刚刚超过了2TB的数据,现在窗口属性的文件夹读取2.02TB。 我不认为这与问题有任何关系,因为我暂时删除了一些文件,以testing小于2TB的大小,并没有什么区别,但我提到它的完整性。 也可能不相关,但提及完整性。 服务器的磁盘configuration是1个OCZ-Agility2 120GB SSD作为系统盘,4个2tb Hdd,主存储器都有连续的序列号(尽可能接近)。 4个大磁盘被configuration为一个raid5设备,没有热备份的MD RAID。 共享名为\ SERVER \ media,所涉及的文件夹位于共享的顶层,称为\ Films。 我已经尝试重新启动服务器和桌面,看看它是否是某种临时的问题,但它似乎没有任何影响。 我有双重检查,我没有改变超过6个星期的桑巴configuration,这个问题已经显示自己 所以…我正在寻找什么我应该尝试的build议,或者如果它是一个已知的限制某些configuration。 在回应评论时: Samba版本3.5.6文件数量:585在28个文件夹中(在Films文件夹内)平均文件大小约为3.5 Gb,没有小于200Mb 已经检查dmesg,一切似乎是为了。 忘了提及。 该文件夹也可以在本地查看为apache目录列表。 这是正常的。 所以在cli上列出目录。 只有桑巴正在经历缓慢的问题。 经过与朋友的电脑testing,似乎问题奠定了窗口(为什么我不感到惊讶) – 无论如何,如果我从任一系统直接访问共享(使用UNCpath)它是好的和快速的,因为它应该是,但是当我通过我的映射networking驱动器访问共享它突然变得非常缓慢。 所以我没有映射和重新映射相同的驱动器号上的份额,但它没有帮助 – 但重映射到不同的驱动器号已帮助。 我猜Windows已经caching了一些不再喜欢的东西。 任何人都知道如何清除?

Oracle数据库标准版(一)如何在双CPU服务器上运行而受益?

我正在评估额外的CPU对Oracle数据库性能的影响。 我正在寻求许可Oracle标准版一 (SEO,最具成本效益)或Oracle标准版 (SE)。 按照Oracle许可条款,您可以在最多2个CPU的服务器上许可Oracle SEO,而Oracle SE可以在4个CPU服务器上获得许可。 我有兴趣知道Oracle将如何使用额外的CPU,具体如下: 数据库只有一个并发用户/连接 数据库主要用于读取数据 – 这是一种数据仓库,它始终读取一个大的事实表 为了在上述情况下提高Oracle性能(假设只有CPU数量增加),将钱投入额外的CPU(和Oracle许可证)是否合理?

如何跟踪不确定的httpd / mysqld活动

我在Fedora 15上运行一个非常标准的LAMP栈,主要是支持一些Drupal站点。 事情似乎一切正常,但有时机器上的磁盘将开始比通常情况下更难工作。 我有限的系统debugging技巧已经发现: “top”报告说httpd和mysqld确实是活跃的,占其他大部分空闲机器的3-4%。 httpd日志文件中没有任何更改,其他系统日志中没有任何exception显示。 所以“有人打你的网站,假人”这个明显的答案似乎并不是这样。 用“apachectl graceful”重置httpd没有任何作用。 然而,“apachectl stop”后跟“apachectl start”通常会使机器停止运转 – 磁盘搅动停止。 我相信机器是安全的; 我没有理由相信有任何骇人听闻的事情发生。 (当然,我想通常是这样的…) 如果这足以让某人告诉我发生了什么,我会感到惊讶(但是很开心!),但是有没有什么build议可以让我更深入地研究一下机器,并弄清楚发生了什么? 谢谢!

Windows 2008 R2 – 如何优化性能监控?

看来有很多“默认”的监控线程正在运行。 我有W2008R2,当我打开性能监视器时,我可以在系统收集器集中看到6个事件跟踪会话。 这是单一的应用程序服务器,我需要确保尽可能less的中断。 我真的不关心诊断和性能报告,我不关心事件。 什么跟踪会话可以相对安全地停止?

仅分析一个Ip的Web服务器性能的步骤

我们有一个2008年的服务器,托pipe40个域名。 我们所有的项目都是在asp.net中开发的,在我们的服务器上使用iis 7.5。 其中近35个域名共享一个IP,另外5个域名共享另一个IP。 一切都很好,直到4天前。 然后我们的一个Ips(与35域共享)开始服务很慢。 Wep页面在加载时挂起。 有趣的是,其他网页共享其他IP都没问题,正在以正常速度加载。 我们检查了http.sys的日志,但发现没有什么不同。 我们检查了iis的日志,什么都没发现。 任何人都可以告诉我们find问题的方法或步骤吗? 提前致谢

通过MSMQ性能问题对IIS进行故障排除 – 有时响应时间长

目前,我在过去几周遇到了麻烦,我需要一些帮助来解决Microsoft Messaging Que服务器的故障。 IIS和MSMQ驻留在相同的serevr。 有几个应用程序服务器处理消息并将其返回给MQ。 架构与此类似: 由于某些原因,有时消息需要大约10多秒才能返回到IIS服务器,我们认为它与MQ有关。 IIS / MQ服务器和应用程序服务器在networking,内存或存储方面没有问题。 每个人似乎都在快速处理,没有任何问题。 我想知道如何通过发送我自己的消息(基于嗅探的数据)来嗅探消息和debuggingMQ,以尝试重现延迟问题。 此外,如果任何人有什么好的方法来解决这个问题,我很乐意接受任何提示。