0

一个 CUDA 源文件可以使用 LLVM 编译器和命令编译成 PTX 格式clang -Xclang -I$LIBCLC/include/generic -I$LIBCLC/include/ptx -Dcl_clang_storage_class_specifiers -O3 cudaFile.cu -S -o ptxOutputFile.ptx --cuda-gpu-arch=sm_XX

其中sm_XX可以替换为sm_20、sm_30。对于计算能力 1.0,当 sm_XX 被替换为 sm_10 时,它给出了错误fatal error: cannot open file '/tmp/shared-25f2f5.s': No such file or directory 1 error generated.

所以看起来 LLVM 的最低计算能力为 2.0。这个假设正确吗?

4

1 回答 1

1

应该是正确的。从 CUDA 7.0 开始,sm_1x 的工具包和驱动程序支持都已停止。如果 sm_20 有效,它必须是最小值。

Tesla 架构的 CUDA 工具包和 CUDA 驱动程序支持 CUDA 工具包和 CUDA 驱动程序不再支持 sm_10、sm_11、sm_12 和 sm_13 架构。因此,CU_TARGET_COMPUTE_1x 枚举值已从 CUDA 标头中删除。

http://developer.download.nvidia.com/compute/cuda/7_0/Prod/doc/CUDA_Toolkit_Release_Notes.pdf

于 2016-05-31T08:46:33.843 回答