缓存是一种提高系统读性能的常见技术，对于读多写少的应用场景，我们经常使用缓存来进行优化。

例如对于用户的余额信息表account(uid, money)，我们在缓存中建立uid到money的键值对，能够极大降低数据库的压力。

有了数据库和缓存两个地方存放数据之后（uid->money），每当需要读取相关数据时（money），操作流程一般是这样的：

缓存的命中率 = 命中缓存请求个数/总缓存访问请求个数 = hit/(hit+miss)

那么问题来了, 当数据money发生变化的时候：

更新/淘汰

上述场景，只是简单的把余额money设置成一个值，那么：

更新缓存的代价很小，此时我们应该更倾向于更新缓存，以保证更高的缓存命中率。

如果余额是通过很复杂的数据计算得出来的，例如业务上除了账户表account，还有商品表product，折扣表 discount 等。更新缓存的代价很大，此时我们应该更倾向于淘汰缓存。

先操作数据库 vs 先操作缓存

对于一个不能保证事务性的操作，一定涉及“哪个任务先做，哪个任务后做”的问题，解决这个问题的方向是：如果出现不一致，谁先做对业务的影响较小，就谁先执行。

由于写数据库与淘汰缓存不能保证原子性，谁先谁后同样要遵循上述原则。

结论：数据和缓存的操作时序，结论是清楚的：先淘汰缓存，再写数据库。

在分布式环境下，数据的读写都是并发的，上游有多个应用，通过一个服务的多个部署（为了保证可用性，一定是部署多份的），对同一个数据进行读写，在数据库层面并发的读写并不能保证完成顺序，也就是说后发出的读请求很可能先完成（读出脏数据）：

在数据库层面，后发出的请求 4 比先发出的请求 2 先完成了，读出了脏数据，脏数据又入了缓存，缓存与数据库中的数据不一致出现了。

能否做到先发出的请求一定先执行完成呢？常见的思路是“串行化”

这里，用任务队列也是不行的。因为从队列读任务并执行也是并发的。不同线程虽然按顺序从队列读取了值，但并不保证他们执行的顺序是读出的顺序。除非只有一个线程来执行，但这样效率就非常低。

另外，通常的业务会有多个数据库连接，多个服务。对于不同服务、不同数据库连接。这些都不能保证串行化。所以，我们要想保证数据串行化，可以考虑从数据上下手。让同一个数据的访问能串行化。

可以尝试:

在主从同步，读写分离的数据库架构下，有可能出现脏数据入缓存的情况，此时串行化方案不再适用了。如:

这种情况请求 A 和请求 B 的时序是完全没有问题的，是主动同步的时延（假设延时1秒钟）中间有读请求读从库读到脏数据导致的不一致。

既然旧数据就是在那1s的间隙中入缓存的，是不是可以在写请求完成后，再休眠1s，再次淘汰缓存，就能将这1s内写入的脏数据再次淘汰掉呢？虽然是可以的，但如果我们同步去做这个操作，会让请求阻塞 1 秒，这肯定是无法接受的，大大降低了写请求的吞吐量，增长了处理时间。

既然无法同步做，可以想到异步去做。做一个异步的任务，在 1 秒后再淘汰一次 cache。

这样会在业务逻辑中加入额外的处理。如果不想在业务逻辑中做这一步，还可以做一个读取 binlog的逻辑，分析 binlog,然后处理缓存。