0

根据事件/摘要模式的文档nvprof,输出如下所示:

==6461== Profiling application: matrixMul 
==6461== Profiling result: 
==6461== Event result: 
//The outputs 

==6461== Metric result: 
//The outputs

默认应该显示 API 调用和内核的延迟、百分比等Profiling result。所以有两个问题:

  1. 为什么没有任何输出下Profiling Result
  2. 我如何也可以nvprof输出Profiling Result
4

1 回答 1

1

为什么分析结果下没有任何输出?

根据文档,它指出:

nvprof以下列模式之一运行。

这些模式是:

  • 3.1.1 汇总模式(默认)
  • 3.1.2 GPU-Trace 和/或 API-Trace 模式
  • 3.1.3 事件/指标汇总模式
  • 3.1.4 事件/度量跟踪模式

您摘录的信息来自3.1.3 Event/metric Summary Mode。当您处于此模式时,您不处于任何其他模式,并且其他模式的数据收集(和输出)描述不适用。

我如何也可以nvprof输出Profiling Result

如果您想基于每个内核捕获指标信息,请使用 3.1.4 事件/指标跟踪模式。然后输出将出现在该Profiling Result部分中。

对于其他组合,不可能nvprof在一次运行中显示任意的分析数据集合。如果您需要仅在特定模式下可用的输出,则需要在该模式下运行才能获得该输出。您可能需要nvprof多次运行才能获取您想要收集的所有输出信息或数据。 nvvp(视觉分析器)这样做(即在后台运行nvprof多次)以便为给定的应用程序视图显示更大范围的数据。

于 2016-06-23T17:36:41.783 回答