我决定将我的 pthread 代码转换为 OpenMP。
在此之前,我使用 Intel/GCC atomic builtins ( __sync_fetch_and_add
family) 做了很多同步。
正如预期的那样lock xadd
,它们在 x64 上与 GCC 和 ICC 一起编译。
但是当在 GCC 上编译时,-fopenmp
我开始在这些位置接到电话。callq ___sync_fetch_and_add_8
和家人。ICC 仍会生成适当优化的代码。
编辑:链接器拒绝链接该 GCC 代码:
$ gcc -O3 -Wall *.o -lpthread -ldl -lgomp
Undefined symbols for architecture x86_64:
"___sync_fetch_and_add_8"
Edit2:这似乎特定于 Apple 的 GCC。我在 Red Hat gcc 4.4.6 上没有看到这种现象
我怎样才能让 GCC 生成与它没有相同的优化内联 asm -fopenmp
?
$ gcc -v
Using built-in specs.
Target: i686-apple-darwin11
Configured with: /private/var/tmp/llvmgcc42/llvmgcc42-2336.11~67/src/configure --disable-checking --enable-werror --prefix=/Applications/Xcode.app/Contents/Developer/usr/llvm-gcc-4.2 --mandir=/share/man --enable-languages=c,objc,c++,obj-c++ --program-prefix=llvm- --program-transform-name=/^[cg][^.-]*$/s/$/-4.2/ --with-slibdir=/usr/lib --build=i686-apple-darwin11 --enable-llvm=/private/var/tmp/llvmgcc42/llvmgcc42-2336.11~67/dst-llvmCore/Developer/usr/local --program-prefix=i686-apple-darwin11- --host=x86_64-apple-darwin11 --target=i686-apple-darwin11 --with-gxx-include-dir=/usr/include/c++/4.2.1
Thread model: posix
gcc version 4.2.1 (Based on Apple Inc. build 5658) (LLVM build 2336.11.00)
$ icc --version
icc (ICC) 12.0.2 20110112
Copyright (C) 1985-2011 Intel Corporation. All rights reserved.
编译
icc -O3 -Wall -std=gnu99 -ipo -xSSE4.1 -axAVX -O3 -Wall -openmp
gcc -O3 -Wall -std=gnu99 -finline-functions -funroll-loops -O3 -Wall -fopenmp