大多时间在家有点无聊,花了点时间研究以前一知半解的东西。
不过要强调的是,这篇文章只针对 X86。
std::atomic 有六种 Memory Order 选项:
memory_order_relaxed,
memory_order_consume,
memory_order_acquire,
memory_order_release,
memory_order_acq_rel,
memory_order_seq_cst
这六种模式在 X86 底下几乎没什么差别的,
用最弱的 memory_order_relaxed 就可以了,
因为 X86 是属于 Strong Memory Model 的架构。
Load-Load, Store-Store, Load-Store 情况下是安全的。
Store-Load 情况下表示,
A 执行绪储存某一变量,
其他执行绪必须同步读到最新的数值,
这时就必须用到原子操作。
如果要理解原子操作的话,
最简单的方法是从硬件角度来思考。
现代的 CPU 有 L1, L2, L3 Cache,
如果你的电脑有多个核心,
当资料放在 L1, L2 Cache 时,
并不保证所有核心对某一变量的值是一致的。
而进行原子操作的动作之后,
变量的值会同步到所有核心的 Cache。
原子操作的方法有很多种:
1. std::atomic<int> x;
2. std::atomic_thread_fence(std::memory_order_relaxed);
3. asm volatile("mfence" ::: "memory"); // 组合语言
4. asm volatile("lock; addl $0,0(%%rsp)" ::: "memory", "cc"); // 好像是更快的组合
语言,我不是很了解
5. InterlockedExchange(); // Win API
效果都是将变量的值同步到所有核心,
这样才能保证多执行绪环境下此变量的全局可见,
Win API 或许效能会稍差一点吧。
参考文章:
C++11中的内存模型上篇 - 内存模型基础
https://tinyurl.com/f36rsus9
C++11中的内存模型下篇 - C++11支持的几种内存模型
https://tinyurl.com/95e33cf5
X86/GCC memory fence的一些见解
https://zhuanlan.zhihu.com/p/41872203