我对 CUDA 很陌生,在这里我的裤子座位上飞了一下......
我正在尝试在我没有管理员权限的远程计算机上调试我的 CUDA 程序。我用 cuda-gdb 编译我的程序,nvcc -g -G
然后尝试调试它。但是,只要 gdb 调用内核(甚至不必输入它,并且它不会发生在主机代码中),我就会得到:
(cuda-gdb) run
Starting program: /path/to/my/binary/cuda_clustered_tree
[Thread debugging using libthread_db enabled]
[1]+ Stopped cuda-gdb cuda_clustered_tree
cuda-gdb 然后将我转储回我的终端。如果我再次尝试运行 cuda-gdb,我会得到
An instance of cuda-gdb (pid 4065) is already using device 0. If you believe
you are seeing this message in error, try deleting /tmp/cuda-dbg/cuda-gdb.lock.
恢复的唯一方法是kill -9
cuda-gdb 和cuda_clustered_
(我假设后者是我的二进制文件的一部分)。
这台机器有两个 GPU,正在运行 CUDA 4.1(我相信 - 安装了很多,但这是我设置的那个)PATH
并且LD_LIBRARY_PATH
编译 + 运行 deviceQuery 和 bandwidthTest 很好。
如果需要,我可以提供更多信息。我搜索了所有可以在网上找到的地方,但没有找到任何帮助。