互联网产品需要快速迭代开发上线,又要保证质量,保证刚上线的系统,一旦出现问题可以很快控制影响面,就需要设计一套灰度发布系统。
灰度发布系统的作用,可以根据配置,将用户的流量导到新上线的系统上,来快速验证新的功能,而一旦出现问题,也可以马上的修复,简单的说,就是一套A/B Test系统。
灰度发布允许带着 Bug 上线,只要 Bug 不是致命的,当然这个 Bug 是不知道的情况下,如果知道就要很快的改掉。
有了上面三个组件,才算一个完整的灰度平台。
灰度必须要有灰度策略,灰度策略常见的方式有以下几种:
-
基于 Request Header 进行流量切分
-
基于 Cookie 进行流量切分
-
基于请求参数进行流量切分
举例:根据请求中携带的用户 uid 进行取模,灰度的范围是百分之一,那么 uid 取模的范围就是 100,模是 0 访问新版服务,模是 1~99 的访问老版服务。
灰度发布策略分为两类:
在上面的简单灰度发布系统架构中我们了解到,灰度发布服务分为上游和下游服务。
上游服务是具体的执行灰度策略的程序,这个服务可以是 Nginx,也可以是微服务架构中的网关层/业务逻辑层,下面我们就来分析一下不同的上游服务,如何落地。
如果上游服务是 Nginx,那么就需要 Nginx 通过 Lua 扩展 Nginx 实现灰度策略的配置和转发,因为 Nginx 本身并不具备灰度策略的执行。
通过 Lua 扩展实现了灰度策略的执行,但是问题又来了,Nginx 本身并不具备接收配置管理平台的灰度策略,这个时候应该怎么办呢?
解决方案:
本地部署 Agent(需要自己开发),接收服务配置管理平台下发的灰度策略,更新 Nginx 配置,优雅重启 Nginx 服务。