我在一个真正的修复。请帮忙。这很紧急。
我有一个生成多个主机(CPU)线程(pthreads)的主机进程。这些线程依次调用 CUDA 内核。这些 CUDA 内核是由外部用户编写的。所以可能是坏内核进入了无限循环。为了克服这个问题,我设置了 2 分钟的超时时间,这将杀死相应的 CPU 线程。
杀死 CPU 线程也会杀死 GPU 上运行的内核吗?就我所测试的而言,它没有。
如何杀死当前在 GPU 中运行的所有线程?
编辑:我使用调用内核的 CPU 线程的原因是,服务器有两个 Tesla GPU。所以线程会交替调度GPU设备上的内核。
谢谢, 阿文德