专栏名称: 芋道源码

纯 Java 源码分享公众号，目前有「Dubbo」「SpringCloud」「Java 并发」「RocketMQ」「Sharding-JDBC」「MyCAT」「Elastic-Job」「SkyWalking」「Spring」等等

面试官：为什么在系统中不推荐双写?

芋道源码 · 公众号 · Java · 2024-10-03 18:06

正文

👉 这是一个或许对你有用的社群
🐱 一对一交流/面试小册/简历优化/求职解惑，欢迎加入「芋道快速开发平台」知识星球。下面是星球提供的部分资料：
《项目实战（视频）》：从书中学，往事上“练”
《互联网高频面试题》：面朝简历学习，春暖花开
《架构 x 系统设计》：摧枯拉朽，掌控面试高频场景题
《精进 Java 学习指南》：系统学习，互联网主流技术栈
《必读 Java 源码专栏》：知其然，知其所以然

👉这是一个或许对你有用的开源项目
国产 Star 破 10w+ 的开源项目，前端包括管理后台 + 微信小程序，后端支持单体和微服务架构。
功能涵盖 RBAC 权限、SaaS 多租户、数据权限、商城、支付、工作流、大屏报表、微信公众号、CRM 等等功能：
Boot 仓库：https://gitee.com/zhijiantianya/ruoyi-vue-pro
Cloud 仓库：https://gitee.com/zhijiantianya/yudao-cloud
视频教程：https://doc.iocoder.cn
【国内首批】支持 JDK 21 + SpringBoot 3.2.2、JDK 8 + Spring Boot 2.7.18 双版本

来源：孤独烟

总结

引言

某日，阿雄跑去面试！于是有如下情形

面试官:"阿雄是吧，做做自我介绍!"阿雄:"我叫阿雄，来自某a国际电商公司！"
面试官:"我看你项目里用了elasticsearch，你是怎么同步数据的呢?"
阿雄:"在代码里写入数据库的时候，同时再写入elasticsearch！"
面试官:"那你如何保证写入数据库，和写入elasticsearch原子性问题呢？ 万一写入数据库成功了，写入elasticsearch失败了怎么处理？"
阿雄:"我还是回去等通知吧！"

OK，以上情形纯属虚构，如有雷同，绝对巧合！

其实这篇文章所探讨的数据同步策略并不限于某两种固定的存储系统之间，而想去探讨一种通用的数据同步策略。主要分为以下三个部分

(1)背景介绍
(2)双写缺点
(3)改良方案

基于 Spring Boot + MyBatis Plus + Vue & Element 实现的后台管理系统 + 用户小程序，支持 RBAC 动态权限、多租户、数据权限、工作流、三方登录、支付、短信、商城等功能
项目地址：https://gitee.com/zhijiantianya/ruoyi-vue-pro
视频教程：https://doc.iocoder.cn/video/

正文

双写缺点

一致性问题打个比方我们现在有两个client，同时往两个DataSouce写数据。

一个client往里头入X为1
一个client往里头入X为5

那么会有如下情形出现

如图所示，两个DataSouce的数据就不一致了，一个为1，一个为5。除非接下来有一个新的请求，对x数据发生了变更，才能修正这种现象！否则，你可能永远都发现不了。

原子性问题因为我们需要同时往DataSource1和DataSource2一起写数据，你需要保证

x1. writeDataSource1();
x2. writeDataSource2();

这两个操作一起成功，或者一起失败！如果采用双写的方法，是避不开这个问题的！

那么有没有通用的办法来解决这些问题呢？有的，只要能按顺序记录数据的变更即可！那具体怎么做呢，我们继续往下看!

改良方案

假设，如果我们能将数据按顺序记录，写入某个消息队列，然后其他系统按消息顺序恢复数据，看看what happen? 此时架构图如下

在该架构下，所有的数据变更写入一个消息队列里去。其他各数据源从消息队列里恢复数据即可！

那么，此时还有一致性问题，和原子性问题么？一致性问题OK，这种情况下，各个数据源之间数据肯定是一致的。因为写入顺序已经在消息队列中定义好，各数据源按照消息队列中的消息顺序，恢复数据即可，并不存在竞争现象。因此，不会出现不一致的问题！原子性问题OK,这种情况下，如果写入DataSource失败会怎么样？例如出现了网络问题，这条消息恢复失败了。这个问题其实好解决，一般我们在顺序根据消息恢复数据的时候，会记录下坐标。如果写入失败，停止恢复数据。下次从该坐标处恢复数据即可。

但是在上面那张图中，写入DataBase是异步写入的。这样就不符合很多业务场景的"写后即读"的要求，因此，在实际落地中，做了一些变更!通用做法是去提取数据库的变化！如下图所示

在该图中的中间件，例如oracle中的oracle golden gate可以提取数据变化。mysql中的canal能提取数据的变化。至于消息队列，可以选用kafka。直接提取数据变化到kafka中，其他数据源从kafka中获取数据，避免了直接双写从而导致一致性和原子性问题。

基于 Spring Cloud Alibaba + Gateway + Nacos + RocketMQ + Vue & Element 实现的后台管理系统 + 用户小程序，支持 RBAC 动态权限、多租户、数据权限、工作流、三方登录、支付、短信、商城等功能
项目地址：https://gitee.com/zhijiantianya/yudao-cloud
视频教程：https://doc.iocoder.cn/video/

总结

本问讨论了在项目中常见的数据同步问题，希望大家有所收获。引言

欢迎加入我的知识星球，全面提升技术能力。

👉 加入方式，“长按”或“扫描”下方二维码噢：

星球的内容包括：项目实战、面试招聘、源码解析、学习路线。

文章有帮助的话，在看，转发吧。
谢谢支持哟 (*^__^*）

面试官：为什么在系统中不推荐双写?

正文

引言

正文

背景介绍

双写缺点

改良方案

总结