6

我想从我的 GPU 应用程序中提取数据以检查其限制。我必须使用nvprof因为应用程序在远程服务器上运行,所以我应该创建一个文件以在Visual Profiler中本地导入。我尝试使用nvprof -o file_name <app> <params>和使用创建文件,nvprof --analysis-metrics --output-profile file_name <app> <params>但是当我在 Visual Profiler 上导入这些文件时,在分析部分中的一些字段为空:“全局内存加载数据不足”、“全局内存存储数据不足”、“内核不足” SM数据”... 我如何生成一个文件(或更多文件)以获得分析部分的所有信息?我用带有标志的nvcc编译 cuda 代码-lineinfo -arch compute_20 -code sm_20 --ptxas-options=-v。以下是一些空字段的示例:在此处输入图像描述

4

1 回答 1

1

您可以尝试添加会话,而不是将 prof 文件导入可视化分析器。我遇到了类似的问题。我所做的是根据此处的说明添加会话,您将能够看到所有信息。

于 2017-05-03T02:57:53.983 回答