我有一个附有 2 个 cuda 卡的桌面,我尝试通过在内核行中放置一些断点来调试 cuda 代码。但是调试器只显示内核函数的入口和结束括号。它没有提供踩到核函数体的能力。它只是忽略。我已经读过,要调试 GPU 内核,您需要将代码运行到系统当前未使用的显卡上。在此基础上,我还尝试通过将活动 GPU 设置为我的第二个(系统未使用)来运行调试器,但调试器仍然忽略内核主体。拥有功能正常的 CUDA 调试器,我该如何解决这个问题?否则编写复杂的 cuda 内核会很痛苦。
可能与 bumblebee Optimus 卡上的当前驱动程序版本相关联,即 304 版本?