5

请看下面的代码:

#include <pthread.h>
#include <boost/atomic.hpp>

class ReferenceCounted {
  public:
    ReferenceCounted() : ref_count_(1) {}

    void reserve() {
      ref_count_.fetch_add(1, boost::memory_order_relaxed);
    }

    void release() {
      if (ref_count_.fetch_sub(1, boost::memory_order_release) == 1) {
        boost::atomic_thread_fence(boost::memory_order_acquire);
        delete this;
      }
    }

  private:
    boost::atomic<int> ref_count_;
};

void* Thread1(void* x) {
  static_cast<ReferenceCounted*>(x)->release();
  return NULL;
}

void* Thread2(void* x) {
  static_cast<ReferenceCounted*>(x)->release();
  return NULL;
}

int main() {
  ReferenceCounted* obj = new ReferenceCounted();
  obj->reserve(); // for Thread1
  obj->reserve(); // for Thread2
  obj->release(); // for the main()
  pthread_t t[2];
  pthread_create(&t[0], NULL, Thread1, obj);
  pthread_create(&t[1], NULL, Thread2, obj);
  pthread_join(t[0], NULL);
  pthread_join(t[1], NULL);
}

这有点类似于Boost.Atomic中的引用计数示例。

主要区别在于嵌入在构造函数中ref_count_被初始化1(一旦构造函数完成,我们就有一个对该ReferenceCounted对象的引用)并且代码不使用boost::intrusive_ptr.

请不要责怪我delete this在代码中使用 - 这是我在工作中的大型代码库中使用的模式,我现在无能为力。

clang 3.5现在,这段代码使用来自主干(详情如下)和ThreadSanitizer (tsan v2)编译,导致 ThreadSanitizer 的以下输出:

WARNING: ThreadSanitizer: data race (pid=9871)
  Write of size 1 at 0x7d040000f7f0 by thread T2:
    #0 operator delete(void*) <null>:0 (a.out+0x00000004738b)
    #1 ReferenceCounted::release() /home/A.Romanek/tmp/tsan/main.cpp:15 (a.out+0x0000000a2c06)
    #2 Thread2(void*) /home/A.Romanek/tmp/tsan/main.cpp:29 (a.out+0x0000000a2833)

  Previous atomic write of size 4 at 0x7d040000f7f0 by thread T1:
    #0 __tsan_atomic32_fetch_sub <null>:0 (a.out+0x0000000896b6)
    #1 boost::atomics::detail::base_atomic<int, int, 4u, true>::fetch_sub(int, boost::memory_order) volatile /home/A.Romanek/tmp/boost/boost_1_55_0/boost/atomic/detail/gcc-atomic.hpp:499 (a.out+0x0000000a3329)
    #2 ReferenceCounted::release() /home/A.Romanek/tmp/tsan/main.cpp:13 (a.out+0x0000000a2a71)
    #3 Thread1(void*) /home/A.Romanek/tmp/tsan/main.cpp:24 (a.out+0x0000000a27d3)

  Location is heap block of size 4 at 0x7d040000f7f0 allocated by main thread:
    #0 operator new(unsigned long) <null>:0 (a.out+0x000000046e1d)
    #1 main /home/A.Romanek/tmp/tsan/main.cpp:34 (a.out+0x0000000a286f)

  Thread T2 (tid=9874, running) created by main thread at:
    #0 pthread_create <null>:0 (a.out+0x00000004a2d1)
    #1 main /home/A.Romanek/tmp/tsan/main.cpp:40 (a.out+0x0000000a294e)

  Thread T1 (tid=9873, finished) created by main thread at:
    #0 pthread_create <null>:0 (a.out+0x00000004a2d1)
    #1 main /home/A.Romanek/tmp/tsan/main.cpp:39 (a.out+0x0000000a2912)

SUMMARY: ThreadSanitizer: data race ??:0 operator delete(void*)
==================
ThreadSanitizer: reported 1 warnings

奇怪的是,它会将大小为 1 的写入写入与在引用计数器上执行原子减量时thread T1相同的内存位置。thread T2

前一种写法怎么解释?它是由类的析构函数执行的一些清理ReferenceCounted吗?

是误报吗?还是代码错了?

我的设置是:

$ uname -a
Linux aromanek-laptop 3.13.0-29-generic #53-Ubuntu SMP Wed Jun 4 21:00:20 UTC 2014 x86_64 x86_64 x86_64 GNU/Linux

$ clang --version
Ubuntu clang version 3.5-1ubuntu1 (trunk) (based on LLVM 3.5)
Target: x86_64-pc-linux-gnu
Thread model: posix

代码编译如下:

clang++ main.cpp -I/home/A.Romanek/tmp/boost/boost_1_55_0 -pthread -fsanitize=thread -O0 -g -ggdb3 -fPIE -pie -fPIC

请注意,在我的机器上,实现boost::atomic<T>解析为ThreadSanitizer 声称可以理解__atomic_load_n的函数系列。

更新 1:使用clang 3.4最终版本时也会发生同样的情况。

更新 2:同样的问题发生在libstdc++-std=c++11libc++中。<atomic>

4

2 回答 2

3

这看起来像一个误报。

方法中的thread_fenceinrelease()强制所有来自fetch_sub-calls 的未完成写入在栅栏返回之前发生。因此,delete下一行的 refcount 不能与之前的写入竞争。

引用C++ Concurrency in Action一书:

如果释放操作存储了一个在与栅栏相同的线程上的栅栏之前由原子操作读取的值,则释放操作与具有 [...]order的 栅栏同步。std::memory_order_acquire

由于减少引用计数是一个读-修改-写操作,这应该适用于此。

详细来说,我们需要保证的操作顺序如下:

  1. 将引用计数减少到 > 1
  2. 将引用计数减少到 1
  3. 删除对象

2.并且3.是隐式同步的,因为它们发生在同一个线程上。1.并且2.是同步的,因为它们都是对相同值的原子读-修改-写操作。如果这两个人可以比赛,那么整个 refcounting 将首先被打破。所以剩下的就是同步1.3.

这正是栅栏的作用。正如我们刚刚讨论的,write from1.是一种release操作,与 同步2.,读取相同的值。3.acquire在同一线程上的栅栏,现在与规范所保证2.的写入同步。1.这种情况不需要acquire对对象进行额外的写入(正如@KerrekSB 在评论中所建议的那样),这也可以工作,但由于额外的写入,效率可能会降低。

底线:不要玩弄内存排序。即使是专家也会弄错它们,它们对性能的影响通常可以忽略不计。因此,除非您在分析运行中证明它们会破坏您的性能并且您绝对必须对其进行优化,否则请假装它们不存在并坚持使用默认值memory_order_seq_cst

于 2014-06-27T08:27:24.413 回答
2

在撰写本文时(2018 年 3 月),ThreadSanitizer 不支持独立内存围栏,只是为了突出@adam-romanek 对其他偶然发现此问题的评论ThreadSanitizer FAQ中提到了这一点,它没有明确提到支持栅栏:

问:支持哪些同步原语?TSan 支持 pthread 同步原语、内置编译器原子操作 (sync/atomic)、llvm libc++ 支持 C++ 操作(虽然没有经过彻底 [原文如此] 测试)。

于 2018-03-08T12:51:32.197 回答