2

我在许多论坛上读到 NVIDIA Visual Profiler 序列化程序以收集时序信息。

然而,在可视化分析器中,在上下文选项卡下,会提供诸如“内存副本和 GPU 上的内核之间没有时间重叠”之类的建议,或者如果内存和内核执行存在重叠,它会显示重叠时间。此外,如果您查看以下网络研讨会 - 幻灯片 6,您可以看到重叠内核的输出跟踪。

我想知道探查器是否可以显示有关并发内核执行的信息(即,如果我们使用 3 个不同的流并行运行 3 个内核,探查器是否可以显示这是否确实发生在 GPU 中)。如果是这样,我可以在视觉分析器中的什么位置获取这些信息。

4

1 回答 1

2

是的。

CUDA Toolkit 5.0 中的 nvprof 和 Visual Profiler (nvvp)(作为预览版提供给注册的 CUDA 开发人员)都支持并发内核执行。

于 2012-08-07T16:17:59.740 回答