[心得] X86 架构下的 Memory Model Instance PTT批踢踢实业坊

[心得] X86 架构下的 Memory Model

楼主: Instance (呆呆华) 2021-07-18 11:24:10

大多时间在家有点无聊，花了点时间研究以前一知半解的东西。
不过要强调的是，这篇文章只针对 X86。
std::atomic 有六种 Memory Order 选项：
memory_order_relaxed,
memory_order_consume,
memory_order_acquire,
memory_order_release,
memory_order_acq_rel,
memory_order_seq_cst
这六种模式在 X86 底下几乎没什么差别的，
用最弱的 memory_order_relaxed 就可以了，
因为 X86 是属于 Strong Memory Model 的架构。
Load-Load, Store-Store, Load-Store 情况下是安全的。
Store-Load 情况下表示，
A 执行绪储存某一变量，
其他执行绪必须同步读到最新的数值，
这时就必须用到原子操作。
如果要理解原子操作的话，
最简单的方法是从硬件角度来思考。
现代的 CPU 有 L1, L2, L3 Cache，
如果你的电脑有多个核心，
当资料放在 L1, L2 Cache 时，
并不保证所有核心对某一变量的值是一致的。
而进行原子操作的动作之后，
变量的值会同步到所有核心的 Cache。
原子操作的方法有很多种：
1. std::atomic<int> x;
2. std::atomic_thread_fence(std::memory_order_relaxed);
3. asm volatile("mfence" ::: "memory"); // 组合语言
4. asm volatile("lock; addl $0,0(%%rsp)" ::: "memory", "cc"); // 好像是更快的组合
语言，我不是很了解
5. InterlockedExchange(); // Win API
效果都是将变量的值同步到所有核心，
这样才能保证多执行绪环境下此变量的全局可见，
Win API 或许效能会稍差一点吧。
参考文章：
C++11中的内存模型上篇 - 内存模型基础
https://tinyurl.com/f36rsus9
C++11中的内存模型下篇 - C++11支持的几种内存模型
https://tinyurl.com/95e33cf5
X86/GCC memory fence的一些见解
https://zhuanlan.zhihu.com/p/41872203

作者: sarafciel (Cattuz) 2021-07-18 22:36:00

呃...我建议原PO去补一下图灵奖神书计算机架构你这篇文章从原子操作开始的东西除了参考应该都是错的

作者: final01 (牛顿运动定律) 2021-07-18 23:11:00

有书在讲这个？？好像都是网络文章吧？所以很片段XD

作者: sarafciel (Cattuz) 2021-07-18 23:25:00

CA也不是专门讲这个的书啦XD 但是要理解这部分issue对CPU的设计跟加速原理要有一定程度的认识

作者: poyenc (发箍) 2021-07-19 02:10:00

好奇你怎么不看 Hans-J. Boehm 的提案还有论文, 而是看网络上的文章

作者: EricTCartman (阿ㄆㄧㄚˇ) 2021-07-19 17:39:00

好奇要是一开始就知道要看Boehm的论文还会愿意发文给楼上酸?

作者: Caesar08 (Caesar) 2021-07-20 01:28:00

楼上，这也不是什么很神秘的资讯，google memory order上面就有写每一个的内容是什么。看不懂也有spec可以读

继续阅读

Re: [问题] Leetcode 744poyenc Re: [问题] Leetcode 744wawi2 [问题] Leetcode 744Kuba4ma [讨论] 平行化计算质数数量noahleft Re: [问题] linked list 实作 stack指标疑问killer0418 [问题] linked list 实作 stack指标疑问irpolo1 [问题] Compiler Optimization 选择loadingN [心得] 关于设计class的衡量方式loveflames [问题] 用template取得array长度ko27tye [问题] 影像撷取卡+openCVsummer34796