[心得] X86 架構下的 Memory Model

看板C_and_CPP作者Instance (呆呆華)時間3年前 (2021/07/18 11:25)推噓0(1推 1噓 9→)

留言11則, 5人參與討論串1/3 (看更多)

大多時間在家有點無聊，花了點時間研究以前一知半解的東西。不過要強調的是，這篇文章只針對 X86。 std::atomic 有六種 Memory Order 選項： memory_order_relaxed, memory_order_consume, memory_order_acquire, memory_order_release, memory_order_acq_rel, memory_order_seq_cst 這六種模式在 X86 底下幾乎沒什麼差別的，用最弱的 memory_order_relaxed 就可以了，因為 X86 是屬於 Strong Memory Model 的架構。 Load-Load, Store-Store, Load-Store 情況下是安全的。 Store-Load 情況下表示， A 執行緒儲存某一變數，其他執行緒必須同步讀到最新的數值，這時就必須用到原子操作。如果要理解原子操作的話，最簡單的方法是從硬體角度來思考。現代的 CPU 有 L1, L2, L3 Cache，如果你的電腦有多個核心，當資料放在 L1, L2 Cache 時，並不保證所有核心對某一變數的值是一致的。而進行原子操作的動作之後，變數的值會同步到所有核心的 Cache。原子操作的方法有很多種： 1. std::atomic<int> x; 2. std::atomic_thread_fence(std::memory_order_relaxed); 3. asm volatile("mfence" ::: "memory"); // 組合語言 4. asm volatile("lock; addl $0,0(%%rsp)" ::: "memory", "cc"); // 好像是更快的組合語言，我不是很了解 5. InterlockedExchange(); // Win API 效果都是將變數的值同步到所有核心，這樣才能保證多執行緒環境下此變數的全局可見， Win API 或許效能會稍差一點吧。參考文章： C++11中的內存模型上篇 - 內存模型基礎 https://tinyurl.com/f36rsus9 C++11中的內存模型下篇 - C++11支持的幾種內存模型 https://tinyurl.com/95e33cf5 X86/GCC memory fence的一些見解 https://zhuanlan.zhihu.com/p/41872203 -- 西之西處，大陸彼岸，我族飛舞，乘馭他風... -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.241.208.49 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/C_and_CPP/M.1626578713.A.0AC.html

→

sarafciel

07/18 22:36, 3年前 , 1^F

07/18 22:36, 1^F

→

sarafciel

07/18 22:40, 3年前 , 2^F

07/18 22:40, 2^F

不是很懂，哪裡有問題在請S大詳述一下，方便後進們學習。

→

final01

07/18 23:11, 3年前 , 3^F