Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我有一个程序,我尝试将主机功能与 GPU 内核重叠。为了检查主机功能与 GPU 内核的重叠程度,我使用了 NVIDIA 的视觉分析器。但是,分析器没有显示我的主机功能的任何计时结果。相反,它只显示 CUDA 内核的 CPU 时间。
有没有办法将宿主函数的计时结果集成到可视化分析器的时间线中?
对的,这是可能的。查看分析器手册中记录的 NVIDIA 工具扩展 API 。
您可能希望在要检查重叠的主机代码部分周围标记一个范围。