簡體 English 中英

獲取/發布與順序一致的內存順序

[英]Acquire/Release versus Sequentially Consistent memory order

原文 2013-02-13 19:50:46 6 2 c++/ concurrency/ c++11/ atomic

對於任何std::atomic<T> ，其中T是原始類型：

如果我將std::memory_order_acq_rel用於fetch_xxx操作，而std::memory_order_acquire用於load操作，而std::memory_order_release用於store操作則是盲目的（我的意思是就像重置這些函數的默認內存順序一樣）

結果是否與我對任何已聲明的操作使用std::memory_order_seq_cst （默認設置）相同？
如果結果相同，就效率而言，此用法與使用std::memory_order_seq_cst有什么不同嗎？

2 個解決方案

用於原子操作的C ++ 11內存排序參數指定對排序的約束。 如果使用std::memory_order_release進行存儲，並且另一個線程的負載使用std::memory_order_acquire讀取值，則第二個線程的后續讀取操作將看到第一個線程之前存儲在任何內存位置的任何值。存儲版本， 或以后存儲到這些存儲位置中的任何一個 。

如果存儲和后續加載均為std::memory_order_seq_cst則這兩個線程之間的關系相同。 您需要更多線程才能看到差異。

例如std::atomic<int>變量x和y都初始為0。

線程1：

x.store(1,std::memory_order_release);

線程2：

y.store(1,std::memory_order_release);

線程3：

int a=x.load(std::memory_order_acquire); // x before y
int b=y.load(std::memory_order_acquire);

線程4：

int c=y.load(std::memory_order_acquire); // y before x
int d=x.load(std::memory_order_acquire);

如所寫，到x和y的存儲之間沒有關系，因此很有可能在線程3中看到a==1 ， b==0在線程4中看到c==1和d==0 。

如果所有內存排序都更改為std::memory_order_seq_cst則這將在存儲之間強制執行對x和y的排序。 因此，如果線程3看到a==1且b==0則這意味着x的存儲必須在y的存儲之前，因此，如果線程4看到c==1 ，則意味着y的存儲已完成，則y存儲到x還必須已完成，因此我們必須具有d==1 。

實際上，根據編譯器和處理器架構的不同，在各處使用std::memory_order_seq_cst會給加載或存儲或兩者都增加額外的開銷。 例如，x86處理器的一種常用技術是為std::memory_order_seq_cst存儲使用XCHG指令而不是MOV指令，以提供必要的排序保證，而對於std::memory_order_release ，則使用普通的MOV就足夠了。 在具有更寬松的內存體系結構的系統上，開銷可能會更大，因為普通加載和存儲的保證較少。

內存排序很難。 我在書中幾乎花了整整一章。

內存排序可能非常棘手，而將其弄錯的影響通常非常微妙。

所有內存排序的關鍵點在於，它保證了“已發生”，而不是即將發生的事情。 例如，如果您將某物存儲到幾個變量中（例如x = 7; y = 11; ），那么另一個處理器可能會在看到y中的值7之前將y視為11。 通過在設置x和y之間使用內存排序操作，您所使用的處理器將保證x = 7; 在繼續存儲y之前已被寫入內存。

在大多數情況下，只要最終更新該值，寫的順序並不重要。 但是，例如，如果我們有一個帶整數的循環緩沖區，那么我們將執行以下操作：

buffer[index] = 32;
index = (index + 1)  % buffersize;

而其他一些線程正在使用index來確定已寫入新值，那么我們需要先寫入32 ，然后在AFTER之后更新index 。 否則，另一個線程可能會獲取old數據。

使信號量，互斥量等工作也同樣適用-這就是為什么術語“釋放”和“獲取”用於內存屏障類型的原因。

現在， cst是最嚴格的排序規則-它強制您對已寫入的數據進行讀寫操作，然后再將它們存儲到內存中，然后處理器才能繼續執行更多操作。 這將比進行特定的獲取或釋放障礙要慢。 它迫使處理器確保存儲和加載已完成，而不是僅存儲或加載。

那有什么不同？ 它高度依賴於系統架構是什么。 在某些系統上，緩存需要部分刷新，並且中斷從一個內核發送到另一個內核，並說“請在繼續之前進行此刷新工作”，這可能需要數百個周期。 在其他處理器上，它只比常規的內存寫入慢了一點點。 X86非常擅長快速執行此操作。 例如，某些類型的嵌入式處理器（某些型號的-不確定？）需要在處理器中做更多的工作才能確保一切正常。

為什么這個獲取和釋放內存柵欄不能給出一致的值？

[英]Why does this acquire and release memory fence not give a consistent value?

與 memory_order_acquire 和 memory_order_release 的原子交換

[英]atomic exchange with memory_order_acquire and memory_order_release

獲取/釋放內存訂購

[英]Acquire/Release Memory Ordering

C++ memory_order_acquire/release問題

[英]C++ memory_order_acquire/release questions

多線程間獲取-釋放memory順序

[英]Acquire-release memory order between multiple threads

為什么這個自旋鎖需要 memory_order_acquire_release 而不僅僅是獲取？

[英]Why does this spinlock require memory_order_acquire_release instead of just acquire?

C++11 memory_order_acquire 和 memory_order_release 語義？

[英]C++11 memory_order_acquire and memory_order_release semantics?

C++ 標准如何使用 memory_order_acquire 和 memory_order_release 防止自旋鎖互斥鎖中的死鎖？

[英]How C++ Standard prevents deadlock in spinlock mutex with memory_order_acquire and memory_order_release?

理解 C++11 中的 `memory_order_acquire` 和 `memory_order_release`

[英]Understanding `memory_order_acquire` and `memory_order_release` in C++11

什么時候可以從 compare_exchange 中安全刪除 memory_order_acquire 或 memory_order_release？

[英]When can memory_order_acquire or memory_order_release be safely removed from compare_exchange?

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 為什么這個獲取和釋放內存柵欄不能給出一致的值？與 memory_order_acquire 和 memory_order_release 的原子交換獲取/釋放內存訂購 C++ memory_order_acquire/release問題多線程間獲取-釋放memory順序為什么這個自旋鎖需要 memory_order_acquire_release 而不僅僅是獲取？ C++11 memory_order_acquire 和 memory_order_release 語義？ C++ 標准如何使用 memory_order_acquire 和 memory_order_release 防止自旋鎖互斥鎖中的死鎖？理解 C++11 中的 `memory_order_acquire` 和 `memory_order_release` 什么時候可以從 compare_exchange 中安全刪除 memory_order_acquire 或 memory_order_release？

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM