我正在尝试实现一个非常简单的代码:
#include <stdio.h>
__global__ void print_kernel() {
printf("Hello from block %d, thread %d\n", blockIdx.x, threadIdx.x);
}
int main() {
print_kernel<<<10, 10>>>();
cudaDeviceSynchronize();
}
但我收到错误,因为系统是一个相当旧的系统,并且此“计算能力 1.1”环境不支持 printf。有没有办法可以打印线程和块号或从设备函数中获取值并在主机函数 main 中观察?