互联网分层架构的本质,是数据的移动。
互联网分层架构演进的核心原则:
让上游更高效的获取与处理数据,复用
让下游能屏蔽数据的获取细节,封装
这些在上一篇《互联网分层架构的本质》中有详尽的描述,在实际系统架构演进过程中,如何利用这两个原则,对系统逐步进行分层抽象呢?咱们先从后端系统开始讲解。
本文主要解答两个问题:
后端架构,什么时候进行DAO层的抽象
后端架构,什么时候进行数据服务层的抽象
核心问题一:什么时候进行DAO层的抽象
一个业务系统最初的后端结构如上:
此时,web-server层如何获取底层的数据呢?
web-server层获取数据的一段伪代码如上,不用纠结代码的细节,也不用纠结不同编程语言与不同数据库驱动的差异,其获取数据的过程大致为:
如果业务不复杂,这段代码写1次2次还可以,但如果业务越来越复杂,每次都这么获取数据,就略显低效了,有大量冗余、重复、每次必写的代码。
如何让数据的获取更加高效快捷呢?
通过技术手段实现:
绝大部分公司正在用的ORM,DAO等技术,就是一种分层抽象,可以提高数据获取的效率,屏蔽连接,游标,结果集这些复杂性。
结论
当手写代码从DB中获取数据,成为通用痛点的时候,就应该抽象出DAO层,简化数据获取过程,提高数据获取效率,向上游屏蔽底层的复杂性。
核心问题二:什么时候要进行数据服务层的抽象
抽象出DAO层之后,系统架构并不会一成不变:
随着业务越来越复杂,业务系统会不断进行垂直拆分
随着数据量越来越大,数据库会进行水平切分
随着读并发的越来越大,会增加缓存降低数据库的压力
于是系统架构变成了这个样子:
业务系统垂直拆分,数据库水平切分,缓存这些都是常见的架构优化手段。
此时,web-server层如何获取底层的数据呢?
根据楼主的经验,以用户数据为例,流程一般是这样的:
先查缓存:先用uid尝试从缓存获取数据,如果cache hit,数据获取成功,返回User实体,流程结束
确定路由:如果cache miss,先查询路由配置,确定uid落在哪个数据库实例的哪个库上
查询DB:通过DAO从对应库获取uid对应的数据实体User
插入缓存:将kv(uid, User)放入缓存,以便下次缓存查询数据能够命中缓存
如果业务不复杂,这段代码写1次2次还可以,但如果业务越来越复杂,每次都这么获取数据,就略显低效了,有大量冗余、重复、每次必写的代码。
特别的,业务垂直拆分成非常多的子系统之后:
不相信业务会垂直拆分成多个子系统?举两个例子:
如果每个子系统都需要关注缓存,分库,读写分离的复杂性,调用层会疯掉的。
如何让数据的获取更加高效快捷呢?
服务化,数据服务层的抽象势在必行。
通过抽象数据服务层:
服务化这里就不展开,更详细的可参考《互联网架构为什么要做服务化?》。
结论
当业务越来越复杂,垂直拆分的系统越来越多,数据库实施了水平切分,数据层实施了缓存加速之后,底层数据获取复杂性成为通用痛点的时候,就应该抽象出数据服务层,简化数据获取过程,提高数据获取效率,向上游屏蔽底层的复杂性。
互联网分层架构是一个很有意思的问题,服务化的引入,并不是越早越好:
请求处理时间可能会增加
运维可能会更加复杂
定位问题可能会更加麻烦
千万别鲁莽的在“微服务”大流之下,草率的进行微服务改造,看似“高大上架构”的背后,隐藏着更多并未接触过的“大坑”。还是那句话,架构和业务的特点和阶段有关:一切脱离业务的架构设计,都是耍流氓。
这一篇先到这里,分层架构,还有很多内容要和大家聊:
后端架构,是否需要抽取中台业务,什么时机抽取
后端架构,是否需要前后端分离,什么时机分离
前端架构,如何进行分层实践
末了,再次强调下,互联网分层架构的本质,是数据的移动。
互联网分层架构演进的核心原则,是让上游更高效的获取与处理数据,让下游能屏蔽掉数据的复杂性获取细节。