一个 CUDA 源文件可以使用 LLVM 编译器和命令编译成 PTX 格式clang -Xclang -I$LIBCLC/include/generic -I$LIBCLC/include/ptx -Dcl_clang_storage_class_specifiers -O3 cudaFile.cu -S -o ptxOutputFile.ptx --cuda-gpu-arch=sm_XX
其中sm_XX可以替换为sm_20、sm_30。对于计算能力 1.0,当 sm_XX 被替换为 sm_10 时,它给出了错误fatal error: cannot open file '/tmp/shared-25f2f5.s': No such file or directory
1 error generated.
所以看起来 LLVM 的最低计算能力为 2.0。这个假设正确吗?