更便宜的 std::atomic 替代品<bool> ?

Question

我在多线程应用程序中有一类对象，其中每个线程都可以将对象标记为删除，然后中央垃圾收集器线程实际删除该对象。 线程通过访问内部 bool 的成员方法进行通信：

class MyObjects {
...   
bool shouldBeDeleted() const
{
   return m_Delete;
}

void
markForDelete()
{
   m_Delete = true;
}
...
   std::atomic< bool >                                        m_IsObsolete;
}

过去，由于 Thread Sanitizer 一直在抱怨，因此其他人已将 bool 设为原子。 但是， perf 现在表明在内部原子负载期间存在处理开销：

   │     ↓ cbz    x0, 3f4                                                                                                                                                                                                                                                                                                                                                                                            

   │     _ZNKSt13__atomic_baseIbE4loadESt12memory_order():                                                                                                                                                                                                                                                                                                                                                           

   │           {                                                                                                                                                                                                                                                                                                                                                                                                     

   │             memory_order __b = __m & __memory_order_mask;                                                                                                                                                                                                                                                                                                                                                       

   │             __glibcxx_assert(__b != memory_order_release);                                                                                                                                                                                                                                                                                                                                                      

   │             __glibcxx_assert(__b != memory_order_acq_rel);                                                                                                                                                                                                                                                                                                                                                      

   │                                                                                                                                                                                                                                                                                                                                                                                                                 

   │             return __atomic_load_n(&_M_i, __m);                                                                                                                                                                                                                                                                                                                                                                 

   │       add    x0, x0, #0x40                                                                                                                                                                                                                                                                                                                                                                                          

 86,96 │       ldarb  w0, [x0]

目标平台为 GCC、Aarch64 和 Yocto Linux。

现在我的问题如下：

在这种情况下真的需要原子吗？ bool 的转换是一种方式（从 false 到 true），在对象存在期间无法返回，因此不一致仅意味着稍后删除对象，对吗？
是否有std::atomic<bool>的替代方案可以使 Thread Sanitizer 静音，但在计算上比std::atomic<bool>便宜？

Answer 1

一个明显的修改可能是指定memory_order_relaxed以最小化内存障碍。

请参阅https://en.cppreference.com/w/cpp/atomic/memory_order

和https://bartoszmilewski.com/2008/12/01/c-atomics-and-memory-ordering/

另请参阅 Herb Sutter 的经典《原子武器》： https : //channel9.msdn.com/Shows/Going+Deep/Cpp-and-Beyond-2012-Herb-Sutter-atomic-Weapons-1-of-2

m_Delete.store (true, std::memory_order_relaxed);

警告（请参阅上面的文章）-如果对被标记为删除的对象存在任何共同依赖关系（例如另一个状态变量、释放资源等），那么您可能需要使用memory_order_release来确保can be deleted标记设置发生在最后和编译器优化器不会重新排序。

假设“垃圾收集器”仅检查can be deleted标志，则不需要在加载中使用memory_order_acquire ； 放松就足够了。 否则，它需要使用获取来保证在读取标志之前不会重新排序任何相互依赖的访问。

Answer 2

问题（如 OP 的评论中所澄清）不是真正的 GC，而是延迟删除单独线程上的对象，以便减轻主处理线程从删除到删除所需的时间。 所有要删除的对象都会在某个时间被标记——稍后删除线程出现并删除它们。

首先考虑：是否真的需要延迟删除才能满足程序的性能目标——特别是延迟？ 实际上影响延迟的可能只是额外的开销。 （或者可能还有不同的性能目标，例如吞吐量，需要考虑。）延迟删除并不是所有情况下的明显性能优势 - 您需要找出在每种情况下它是否合适。 （例如，它甚至可能不是所有删除都必须的：也许某些删除可以在不影响性能的情况下立即执行，而其他删除则需要延迟。这可能是因为，例如，不同的处理线程正在执行不同的操作不同的延迟/吞吐量要求。）

现在有一个解决方案：由于我们正在谈论延迟删除 - 删除线程没有理由需要扫描所有对象以查找要删除的对象（每次进行完整扫描时）。 相反，在将对象标记为删除时支付稍高的成本，而无需支付扫描所有对象的成本。 通过将已删除的对象链接到删除工作列表来执行此操作。 那里有一个同步成本（除了明显的锁之外，还可以通过各种方式将其最小化），但它是为每个对象支付一次，而不是每个对象每次扫描支付一次。

（也不必是链表。如果在一段时间内可以删除多少对象有上限，您可以使用适当的数组。）

通过将这个问题更准确地描述为“延迟删除”而不是“垃圾收集”，还开辟了其他可能性：取消了一些限制（也许添加了其他限制）。

更便宜的 std::atomic 替代品<bool> ?

问题描述

2 个解决方案

解决方案1
3 2020-10-16 14:09:25

解决方案2
2 2020-10-16 14:53:41

更便宜的 std::atomic 替代品<bool> ?

问题描述

2 个解决方案

解决方案1 3 2020-10-16 14:09:25

解决方案2 2 2020-10-16 14:53:41

解决方案1
3 2020-10-16 14:09:25

解决方案2
2 2020-10-16 14:53:41