apache php-fpm – max_children达到 – >服务器无响应,直到php-fpm重启

我们的一台服务器设置非常特殊,对未知事件非常敏感。

硬件:

  • Xen – VM
  • 22个内核(采用英特尔至强4 * 6内核)
  • RAID 6 SSD
  • 60 GB RAM

组态:

  • Suse Openlinux 13.1
  • Apache2.4 – 事件
  • PHP 5.5.14
  • mod_proxy_fcgi
  • PHP-FPM
  • 33年5月5日,MariaDB的

工作量:

  • 围绕120个不同的网站
  • Typo3-Sites(其余的也是由php驱动的)中的60个是120个。

问题:

但有时候,例如,当我们有一个包括mysqldump运行的备份工作时,我们有一个又一个的虚拟主机发出“max_children达到”信号并停止响应的问题。 当然,我们在低交通时间做备份,我们会接受一个短暂的“没有回应”,但这个僵局或封锁永远不会自行结束。 在手动重新启动php-fpm之后,任何事情都是好的。

即使在高交通时间,这个系统的正常行为也是完美无瑕,闪电般的。 大多数的核心是驴,我知道的其他参数是好的。

当然,在消息日志中(除​​了“max_children reached”之外)都没有提示日志文件条目,也没有任何的apache / vhosts日志。 是的,内存使用和开放的过程迅速增加。

有没有人有像我们这样的设置(我知道这个怪物里面有很多特别的东西),并且具有相同的或者看起来像是类似的问题,以及如何debugging这个问题的很酷的想法?