我知道具有 2.x 或更高计算能力的 NVIDIA gpus 可以同时执行多达 16 个内核。但是,我的应用程序产生了 7 个“进程”,这 7 个进程中的每一个都启动 CUDA 内核。
我的第一个问题是这些内核的预期行为是什么。它们是否也会同时执行,或者由于它们是由不同的进程启动的,它们会按顺序执行。
我很困惑,因为 CUDA C 编程指南说:
“来自一个 CUDA 上下文的内核不能与来自另一个 CUDA 上下文的内核同时执行。” 这让我想到了第二个问题,什么是 CUDA“上下文”?
谢谢!