问题一
如果使用memcache
写db的时候
1. 先invalidate cache 再写db
2. 先写db 再invaludate cache
3. update cache 然后 update db
4. update db 然后 update cache
我以为这个动作有标准做法,但是问了在亚马和snapchat的朋友
也看了几个tech talk 竟然答案不同,请问大家怎么分析?
我上了一个网络课程的课,他说2是最佳解
case3 & 4 如果某一个update fail都会造成cache里面脏数据的情况
case1:
user1 invalidate cache, while updating db(未完成)
user2 此时读资料,cache miss,去读数据库,得到旧数据,
并用旧数据update cache
user1 完成db更新
此时cache存著旧数据,db新数据,cache脏数据
case2:
user1 update db (未完成)
user2 此时读资料,在cache读了旧资料,离开
user1 finish db and update cache
以后的user都可以读到最新数据,只有user2读了旧数据,但仅只一次,无伤大雅
问题二
还有一个问题,关于db consistency
如果用relational db, such as MySQL , Master Slave
write to master,
read from slave
写到master之后(假设user update一个url link),并且invalid cache
这时候replication还没完成,假设有5秒的延迟
这个时候如果来了一个read,cache miss
按照逻辑,这时候应该slave read , 但这时候slave data是旧的
那我的client要怎么处理?
reddit founder 他说当初他们碰到这情况
很多slave里面的link都是404 very bad user experience
所以他写db的时候,同时写到cache
https://youtu.be/cDL7ny_hvio?t=50s
但如果同时写DB & cache 如果其中一个操作失败了,那就造成脏数据了,不是吗?
又如果
我采用问题一的方式 先写db 然后invalidate cache,
write to master db , 5 sec replication time
这时候一个read进来, cache miss, read from slave取得旧数据
顺便update cache
五秒后slave完成replica,但这时候也造成了数据不一致。
replication latency的问题该怎么解决呢?
感谢