我在 Arch Linux 上运行:
我在多个地方读到内核调用相对于 CPU 是异步的(将立即返回并允许 CPU 继续)。但是,我没有得到这种行为。
例如
kernel<<<blocks,threads>>>();
printf("print immediately\n");
check_cuda_error();
CPU 似乎被锁定并且在内核完成之前没有任何东西被打印(同样没有其他任何东西被执行)到控制台。使用各种不同执行时间(1s、2s、3s 等)的内核进行测试,并进行计算以确保它不是我的内核。
这是驱动问题吗?还是我误解了什么