专栏名称: 高效运维
高效运维公众号由萧田国及朋友们维护,经常发布各种广为传播的优秀原创技术文章,关注运维转型,陪伴您的运维职业生涯,一起愉快滴发展。
目录
相关文章推荐
InfoQ架构头条  ·  从架构角度认识AI:为架构师解读机器学习与生 ... ·  1 周前  
51好读  ›  专栏  ›  高效运维

大厂经验:两步搞定PHP-FPM优化,让服务器更平稳

高效运维  · 公众号  · 运维  · 2017-08-08 07:10

正文

导言:Web服务器的CPU指标和MEM指标异常,不稳定?可能是PHP-FPM进程重启机制的问题导致的,一同和百度外卖探索下如何优化吧。

作者简介:

猛哥
百度外卖基础架构部在线开发方向负责人
负责在线开发框架的持续优化和长期演进,主导研发的WFE/WODP/WOSP组成一套完整高效的WEB架构,支撑百度外卖所有在线服务高速高质量地发展。

百度外卖基础架构部在线开发团队
擅长自底向上地创造和优化基础框架、基础库和基础服务,对NGINX和PHP有深层次的理解和创新性的改造。天下大事必作于细,百度外卖基础架构部在线开发团队,将持续精耕细作,适时发布成熟有效的在线服务优化方案,期待与同行保持交流,共同进步。

摘要

通过优化PHP-FPM进程重启机制,改善线上服务器CPU_IDLEMEM_USED波动的问题,使服务器资源利用率更加平滑可靠。

背景

外卖交易服务集群报出在监控图上CPU_IDLE波动剧烈,如图所示。

事实上一直以来,不仅PU_IDLE存在一定的波动,MEM_USED的周期性断崖式下降再回升也早已司空见惯。那么CPU_IDLEMEM_UESD的波动是否存在关联,追溯这种现象产生的原因,我们就必须理解PHP-FPM进程管理器的机制。

原理

在PHP5.3.3版本中,PHP-FPM正式被官方收编,作为FastCGI管理器,支持平滑停止启动进程、slow-log、动态进程、运行状态等特性。

PHP-FPM进程管理支持三种方式:staticdynamicondemand。我们选用的是static方式,即PHP-FPM生成固定数量的FastCGI进程,这种方式比较简单,避免了频繁开启关闭进程的开销。(在线下虚拟机环境中,进程管理可以配置成ondemand,既降低了内存需求又避免了进程数量不够用)

回到面临的问题上,CPU_IDLEMEM_USED的周期性波动是如何产生的。首先这是一种所有的集群都存在的现象,然后交易服务集群表现尤为突出。在排查了应用程序(比如日志采集程序、定时脚本)的影响后,思路落在了PHP-FPM的一个关键参数上:max_requests

max_requests这个参数使FastCGI进程在处理一定数量的请求后自动重启,以此避免第三方扩展内存泄漏产生破坏性影响。打开线上配置,发现外卖交易服务集群中配置该参数过小,为1000,这便造成了在请求高峰期,FastCGI频繁重启,对CPU产生了负担。于是将max_requests参数调整为10000后,CPU_IDLE表现得到了改善,如图。

但是经过观察发现,CPU_IDLEMEM_USED周期性波动的问题并没有根除,效果如图。

这很好理解,我们调大max_requests参数,但是FastCGI重启机制依然生效,每个请求都会计数,当计数到达max_request之后,cgi进程会执行 fcgi_finish_request退出进程,子进程退出,fpm-master进程会收到SIGCHLD信号,运行fpm_children_bury重启进程,重启的方式是fork一个子进程。

FastCGI进程通过unix socket承接Nginx请求,负载较为均衡,生产环境流量大,PHP进程数配置较大,数以百计的FastCGI会在同一时间到达 max_requests上限而进行重启,这便造成了CPU_IDLEMEM_USED周期性波动。

优化

max_requests的初衷是为了避免第三方扩展引起的内存泄漏问题,虽然线上环境使用的扩展经过分析和测试,并没有严重的内存泄漏问题,但是由于扩展内部使用的第三方库太多,并无法完全避免内存泄漏问题,同时max_requests机制很适合FastCGI多进程环境,以较小的代价,换取内存泄漏的长治久安。

为了避免CPU_IDLEMEM_USED周期波动,同时保持max_requests机制,需要在PHP-FPM源码上稍作修改。FastCGI进程在启动时,设置max_requests,此时只要将max_requests配置参数散列开,使FastCGI进程分别配置不同的值,即可达到效果。

具体代码在sapi/fpm/fpm/fpm.c,修改如下:

php_mt_srand(GENERATE_SEED()); *max_requests=fpm_globals.max_requests+php_mt_rand()&8191;

总结

经过修改上线,对比效果见下图

至此CPU_IDLEMEM_USED已经告别了周期性波动,避免了CPU计算资源产生浪涌效果,内存占用数据也更加真实可靠。

以此文抛砖引玉,PHP-FPM在生产环境的精细优化,任重而道远。

近期好文:

不会 Python 的运维都将失业?(内含福利)

所谓靠谱的人,就是凡事有交代,件件有着落,事事有回音(好文推荐)

运维心法 | 6大技能让你告别背「锅」

8亿人晒军装:背后的运维技术大揭密!



认知革新!风靡全球的顶级盛会 DevOpsDays 首度来沪


了解更多大会内容及抢票请进官网:

长按二维码 报名参会


购票咨询及团购优惠请联系主办方:

Tel:130 2108 2989




点击阅读原文访问活动官网