编译 CUDA 代码时,您必须选择要为哪种架构生成代码。nvcc
提供了两个参数来指定这个架构,基本上:
arch
指定虚拟架构,可以是compute_10
、compute_11
等。code
指定真实的架构,可以是sm_10
,sm_11
等。
所以像这样的命令:
nvcc x.cu -arch=compute_13 -code=sm_13
将为具有 1.3 计算能力的设备生成“立方体”代码。如果我错了,请纠正我。我想知道这两个参数的默认值是什么?当没有为or指定值时,nvcc 使用的默认架构是什么? arch
code