[心得] X86 架構下的 Memory Model
大多時間在家有點無聊,花了點時間研究以前一知半解的東西。
不過要強調的是,這篇文章只針對 X86。
std::atomic 有六種 Memory Order 選項:
memory_order_relaxed,
memory_order_consume,
memory_order_acquire,
memory_order_release,
memory_order_acq_rel,
memory_order_seq_cst
這六種模式在 X86 底下幾乎沒什麼差別的,
用最弱的 memory_order_relaxed 就可以了,
因為 X86 是屬於 Strong Memory Model 的架構。
Load-Load, Store-Store, Load-Store 情況下是安全的。
Store-Load 情況下表示,
A 執行緒儲存某一變數,
其他執行緒必須同步讀到最新的數值,
這時就必須用到原子操作。
如果要理解原子操作的話,
最簡單的方法是從硬體角度來思考。
現代的 CPU 有 L1, L2, L3 Cache,
如果你的電腦有多個核心,
當資料放在 L1, L2 Cache 時,
並不保證所有核心對某一變數的值是一致的。
而進行原子操作的動作之後,
變數的值會同步到所有核心的 Cache。
原子操作的方法有很多種:
1. std::atomic<int> x;
2. std::atomic_thread_fence(std::memory_order_relaxed);
3. asm volatile("mfence" ::: "memory"); // 組合語言
4. asm volatile("lock; addl $0,0(%%rsp)" ::: "memory", "cc"); // 好像是更快的組合
語言,我不是很了解
5. InterlockedExchange(); // Win API
效果都是將變數的值同步到所有核心,
這樣才能保證多執行緒環境下此變數的全局可見,
Win API 或許效能會稍差一點吧。
參考文章:
C++11中的內存模型上篇 - 內存模型基礎
https://tinyurl.com/f36rsus9
C++11中的內存模型下篇 - C++11支持的幾種內存模型
https://tinyurl.com/95e33cf5
X86/GCC memory fence的一些見解
https://zhuanlan.zhihu.com/p/41872203
--
西之西處,大陸彼岸,我族飛舞,乘馭他風...
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.241.208.49 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/C_and_CPP/M.1626578713.A.0AC.html
→
07/18 22:36,
3年前
, 1F
07/18 22:36, 1F
→
07/18 22:40,
3年前
, 2F
07/18 22:40, 2F
不是很懂,哪裡有問題在請S大詳述一下,方便後進們學習。
→
07/18 23:11,
3年前
, 3F
07/18 23:11, 3F
→
07/18 23:25,
3年前
, 4F
07/18 23:25, 4F
→
07/18 23:26,
3年前
, 5F
07/18 23:26, 5F
推
07/19 02:10,
3年前
, 6F
07/19 02:10, 6F
→
07/19 02:10,
3年前
, 7F
07/19 02:10, 7F
※ 編輯: Instance (118.167.163.61 臺灣), 07/19/2021 11:51:35
噓
07/19 17:39,
3年前
, 8F
07/19 17:39, 8F
→
07/19 17:40,
3年前
, 9F
07/19 17:40, 9F
→
07/20 01:28,
3年前
, 10F
07/20 01:28, 10F
→
07/20 01:30,
3年前
, 11F
07/20 01:30, 11F
討論串 (同標題文章)
以下文章回應了本文 (最舊先):
完整討論串 (本文為第 1 之 3 篇):