专栏名称: 架构文摘
每天一篇架构领域重磅好文,涉及一线互联网公司的互联网应用架构、大数据、机器学习等各个热门领域。
目录
相关文章推荐
架构师之路  ·  我抢跑了,跟顶级专家学DeepSeek去... ·  昨天  
架构师之路  ·  神了!最大化deepseek潜能 - ... ·  2 天前  
美团技术团队  ·  预测技术在美团弹性伸缩场景的探索与应用 ·  昨天  
高可用架构  ·  一次线上生产库的全流程切换完整方案 ·  3 天前  
Java架构师技术  ·  SpringBoot+Flowable:一个 ... ·  2 天前  
Java架构师技术  ·  SpringBoot+Flowable:一个 ... ·  2 天前  
51好读  ›  专栏  ›  架构文摘

数据库之架构:主备+分库?主从+读写分离?

架构文摘  · 公众号  · 架构  · 2019-04-23 09:00

正文

一、数据库架构原则

  1. 高可用

  2. 高性能

  3. 一致性

  4. 扩展性

二、常见的架构方案

方案一: 主备架构,只有主库提供读写服务,备库冗余作故障转移用

  1. jdbc:mysql://vip:3306/xxdb

1、 高可用分析: 高可用,主库挂了,keepalive(只是一种工具)会自动切换到备库。 这个过程对业务层是透明的,无需修改代码或配置。

2、 高性能分析: 读写都操作主库,很容易产生瓶颈。 大部分互联网应用读多写少,读会先成为瓶颈,进而影响写性能。 另外,备库只是单纯的备份,资源利用率50%,这点方案二可解决。

3、 一致性分析: 读写都操作主库,不存在数据一致性问题。

4、 扩展性分析: 无法通过加从库来扩展读性能,进而提高整体性能。

5、 可落地分析: 两点影响落地使用。 第一,性能一般,这点可以通过建立高效的索引和引入缓存来增加读性能,进而提高性能。 这也是通用的方案。 第二,扩展性差,这点可以通过 分库分表 来扩展。

方案二: 双主架构,两个主库同时提供服务,负载均衡

  1. jdbc:mysql://vip:3306/xxdb

1、 高可用分析: 高可用,一个主库挂了,不影响另一台主库提供服务。 这个过程对业务层是透明的,无需修改代码或配置。

2、 高性能分析: 读写性能相比于方案一都得到提升,提升一倍。

3、 一致性分析: 存在数据一致性问题。 请看, 一致性解决方案

4、 扩展性分析: 当然可以扩展成三主循环,但笔者不建议(会多一层 数据同步 ,这样同步的时间会更长)。 如果非得在数据库架构层面扩展的话,扩展为方案四。

5、 可落地分析: 两点影响落地使用。 第一,数据一致性问题, 一致性解决方案 可解决问题 第二,主键冲突问题,ID统一地由分布式ID生成服务来生成可解决问题。

方案三: 主从架构,一主多从,读写分离

  1. jdbc:mysql://master-ip:3306/xxdb

  2. jdbc:mysql://slave1-ip:3306/xxdb

  3. jdbc:mysql://slave2-ip:3306/xxdb

1、 高可用分析: 主库单点,从库高可用。 一旦主库挂了,写服务也就无法提供。

2、 高性能分析: 大部分互联网应用读多写少,读会先成为瓶颈,进而影响整体性能。 读的性能提高了,整体性能也提高了。 另外,主库可以不用索引,线上从库和线下从库也可以建立不同的索引(线上从库如果有多个还是要建立相同的索引,不然得不偿失; 线下从库是平时开发人员排查线上问题时查的库,可以建更多的索引)。

3、 一致性分析: 存在数据一致性问题。 请看, 一致性解决方案

4、 扩展性分析: 可以通过加从库来扩展读性能,进而提高整体性能。 (带来的问题是,从库越多需要从主库拉取binlog日志的端就越多,进而影响主库的性能,并且 数据同步 完成的时间也会更长)

5、 可落地分析: 两点影响落地使用。 第一,数据一致性问题, 一致性解决方案 可解决问题 第二,主库单点问题,笔者暂时没想到很好的解决方案。

注: 思考一个问题,一台从库挂了会怎样? 读写分离之读的负载均衡策略怎么容错?

方案四: 双主+主从架构,看似完美的方案

  1. jdbc:mysql://vip:3306/xxdb

  2. jdbc:mysql://slave1-ip:3306/xxdb

  3. jdbc:mysql://slave2-ip:3306/xxdb

1、 高可用分析: 高可用。

2、 高性能分析: 高性能。

3、 一致性分析: 存在数据一致性问题。 请看, 一致性解决方案

4、 扩展性分析: 可以通过加从库来扩展读性能,进而提高整体性能。 (带来的问题 同方案二

5、 可落地分析: 同方案二 ,但 数据同步 又多了一层,数据延迟更严重

三、一致性解决方案

第一类: 主库和从库一致性解决方案

注: 图中圈出的是数据同步的地方,数据同步(从库从主库拉取binlog日志,再执行一遍)是需要时间的,这个同步时间内主库和从库的数据会存在不一致的情况。 如果同步过程中有读请求,那么读到的就是从库中的老数据。 如下图。

既然知道了数据不一致性产生的原因,有下面几个解决方案供参考:

1、直接忽略,如果业务允许延时存在,那么就不去管它。

2、强制读主,采用 主备架构 方案,读写都走主库。 用缓存来扩展数据库读性能 。 有一点需要知道: 如果缓存挂了,可能会产生雪崩现象,不过一般分布式缓存都是高可用的。

3、选择读主,写操作时根据库+表+业务特征生成一个key放到Cache里并设置超时时间(大于等于主从数据同步时间)。 读请求时,同样的方式生成key先去查Cache,再判断是否命中。 若命中,则读主库,否则读从库。 代价是多了一次缓存读写,基本可以忽略。

4、半同步复制,等主从同步完成,写请求才返回。 就是大家常说的“半同步复制”semi-sync。 这可以利用数据库原生功能,实现比较简单。 代价是写请求时延增长,吞吐量降低。

5、数据库中间件,引入开源(mycat等)或自研的数据库中间层。 个人理解,思路同 选择读主。 数据库中间件的成本比较高,并且还多引入了一层。 **

**







请到「今天看啥」查看全文