c++ - pthread_mutex 锁是否提供比用户在代码中施加的内存屏障更高的性能

Question

问题背景

有问题的代码与 C++ 实现有关。我们有代码库，对于某些关键实现，我们确实使用asm volatile ("mfence":"memory").

我对记忆障碍的理解是——

问题

PS：

在我们的代码中，在asm volatile ("mfence":"memory")10-15 行 c++ 代码（成员函数）之后使用了。所以我的疑问是 - 可能是内存同步的多文本实现在用户实现的代码中提供了比 MB 更好的性能（wrt 范围为 MB）。
我们正在使用具有四核处理器的 SUSE Linux 10、2.6.16.46、smp#1、x64_86。

score 2 · Accepted Answer

pthread 互斥体保证比内存栅栏指令慢（我不能说慢了多少，这完全取决于平台）。原因很简单，为了成为兼容的 posix 互斥锁，它们必须包括内存保证。posix 互斥体具有强大的内存保证，因此我无法看到如果没有这样的栅栏*它们将如何实现。

如果您正在寻找实用的建议，我在许多地方使用栅栏而不是互斥锁，并且经常对它们进行计时。与原始内存栅栏相比，Linux 上的 pthread_mutexes 非常慢（当然，它们做得更多，所以要小心你实际比较的内容）。

但是请注意，某些原子操作，特别是 C++11 中的那些，可以而且肯定会比你使用栅栏更快。在这种情况下，编译器/库理解架构并且不需要使用完整的栅栏来提供内存保证。

另请注意，我说的是锁本身的低级性能。您需要分析到纳秒级。

*可以想象一个互斥系统忽略某些类型的内存并选择更宽松的锁定实现（例如依赖正常内存的排序保证并忽略特殊标记的内存）。然而，我认为这样的实现是无效的。

1 回答 1