0

我正在尝试通过 ssh 在远程集群上使用 cuda-gdb 调试我的代码。节点上有 6 个 Tesla C2070 gpu:

$ deviceQuery | grep "^Device"
Device 0: "Tesla C2070"
Device 1: "Tesla C2070"
Device 2: "Tesla C2070"
Device 3: "Tesla C2070"
Device 4: "Tesla C2070"
Device 5: "Tesla C2070"

但是当我在cuda-gdb下运行代码时,它仍然给我错误代码=24:“致命:所有CUDA设备都用于显示,不能在调试时使用。”

我已经设置-gencode arch=compute_20,code=sm_20并编译得很好。当我输入info cuda devices调试器时,它会吐出No CUDA devices. 我也尝试了导出CUDA_VISIBLE_DEVICES="0,2",但仍然无法正常工作。我应该怎么办?我正在使用 cuda 5.0。提前致谢。

4

1 回答 1

1

尝试运行“lsof /dev/nvidia*”,它会告诉你哪个程序保持设备节点打开。如果 X 正在使用这些 GPU,则从输出中可以明显看出。

于 2013-04-01T17:22:17.860 回答