我的新课
《C2C 电商系统微服务架构120天实战训练营》
在公众号
儒猿技术窝
上线了,感兴趣的同学,可以长按扫描下方二维码了解课程详情:
课程大纲请参见文末
前言
在分布式系统中,缓存和数据库同时存在时,如果有写操作的时候,先操作数据库还是先操作缓存呢?
先思考一下,可能会存在哪些问题,再往下看。
下面我分几种方案阐述。
缓存维护方案一
假设有一写(线程A)一读(线程B)操作,
先操作缓存,在操作数据库
,如下流程图所示
1)线程A发起一个写操作,第一步del cache
2)线程A第二步写入新数据到DB
3)线程B发起一个读操作,cache miss,
4)线程B从DB获取最新数据
5)请求B同时set cache
这样看,没啥问题
。
我们再看第二个流程图,如下:
1)线程A发起一个写操作,第一步del cache
2)此时线程B发起一个读操作,cache miss
3)线程B继续读DB,读出来一个老数据
4)然后老数据入cache
5)线程A写入了最新的数据
OK,酱紫,就有问题了吧,老数据入到缓存了,
每次读都是老数据啦,缓存与数据与数据库数据不一致
。
缓存维护方案二
双写操作,
先操作缓存,在操作数据库
。
1)线程A发起一个写操作,第一步set cache
2)线程A第二步写入新数据到DB
3)线程B发起一个写操作,set cache,
4)线程B第二步写入新数据到DB
这样看,也没啥问题。
,但是有时候可能事与愿违,我们再看第二个流程图,如下:
1)线程A发起一个写操作,第一步set cache
2)线程B发起一个写操作,第一步setcache
3)线程B写入数据库到DB
4)线程A写入数据库到DB
执行完后,缓存保存的是B操作后的数据,数据库是A操作后的数据,
缓存和数据库数据不一致
。
缓存维护方案三
一写(线程A)一读(线程B)操作,
先操作数据库,再操作缓存
。
1)线程A发起一个写操作,第一步write DB
2)线程A第二步del cache
3)线程B发起一个读操作,cache miss
4)线程B从DB获取最新数据
5)线程B同时set cache
这种方案
没有明显的并发问题
,但是有可能
步骤二删除缓存失败
,虽然概率比较小,
优于方案一和方案二
,平时工作中也是使用方案三。
综上对比,我们一般采用方案三,但是有没有完美全解决方案三的弊端的方法呢?
缓存维护方案四
这个是方案三的改进方案,都是先操作数据库再操作缓存,我们来看一下流程图:
通过数据库的
binlog
来
异步淘汰key
,以mysql为例,可以
使用阿里的canal将binlog日志采集发送到MQ队列
里面,然后通过
ACK机制
确认处理 这条更新消息,删除缓存,保证数据缓存一致性。
但是呢还有个
问题,如果是主从数据库呢
?
缓存维护方案五
主从DB问题: