根据 OpenMP 规范 (v4.0),以下程序包含由于不同步的读/写导致的可能的数据竞争i
:
int i{0}; // std::atomic<int> i{0};
void write() {
// #pragma omp atomic write // seq_cst
i = 1;
}
int read() {
int j;
// #pragma omp atomic read // seq_cst
j = i;
return j;
}
int main() {
#pragma omp parallel
{ /* code that calls both write() and read() */ }
}
我想到的可能解决方案在代码中显示为注释:
- 保护写入和读取
i
with#pragma omp atomic write/read
, - 保护写入和读取
i
with#pragma omp atomic write/read seq_cst
, - 使用
std::atomic<int>
而不是int
作为i
.
以下是 x86_64 上编译器生成的指令(-O2
在所有情况下都有):
GNU g++ 4.9.2: i = 1; j = i;
original code: MOV MOV
#pragma omp atomic: MOV MOV
// #pragma omp atomic seq_cst: MOV MOV
#pragma omp atomic seq_cst: MOV+MFENCE MOV (see UPDATE)
std::atomic<int>: MOV+MFENCE MOV
clang++ 3.5.0: i = 1; j = i;
original code: MOV MOV
#pragma omp atomic: MOV MOV
#pragma omp atomic seq_cst: MOV MOV
std::atomic<int>: XCHG MOV
Intel icpc 16.0.1: i = 1; j = i;
original code: MOV MOV
#pragma omp atomic: * *
#pragma omp atomic seq_cst: * *
std::atomic<int>: XCHG MOV
* Multiple instructions with calls to __kmpc_atomic_xxx functions.
我想知道为什么 GNU/clang 编译器不为#pragma omp atomic
写入生成任何特殊指令。我希望与 for 类似的说明std::atomic
,即,要么MOV+MFENCE
要么XCHG
。有什么解释吗?
更新
g++ 5.3.0MFENCE
为#pragma omp atomic write seq_cst
. 这是正确的行为,我相信。没有seq_cst
,它会产生普通的MOV
,这对于非 SC 原子性来说已经足够了。
我的 Makefile 中有一个错误,g++ 4.9.2MFENCE
也为 CS atomic write 生成。对不起,伙计们。
Clang 3.5.0 没有实现 OpenMP SC 原子,感谢 Hristo Iliev 指出这一点。