我想在http://docs.nvidia.com/cuda/pdf/ptx_isa_3.1.pdf中使用 SIMD 视频指令(vadd4、vmax4 等)第 8.7.13 节
我在我的代码中尝试了以下内容
asm("vadd4.u32.u32.u32 %0, %1, %2, %3;" : "=r"(i) : "r"(j) : "r"(k) : "r"(l));
其中 i,j,k,l 是 int 变量。我使用了“r”,因为它是 .u32 reg 的约束
但是在编译时,我收到以下错误
错误:未知的寄存器名称“r”
我应该在这里用什么代替“r”?还是代码中还有其他问题?(我使用的是计算能力为 3.5 的 Tesla 卡)