0

当我尝试通过 Nvidia 的nvprof分析器运行我使用 OpenACC 开发的程序时,我收到了主题中的消息,如下所示:

nvprof ./SFS 4

如果我运行nvprof-o [output_file]未出现警告消息,但未创建输出文件。这里有什么问题?

LD_LIBRARY_PATH设置在我的.bashrcto:/opt/nvidia/hpc_sdk/Linux_x86_64/20.7/cuda/11.0/lib64/因为我在那里找到了这些文件(它们的名称中有“cupti”和“inj”,我认为它们是需要的):

lrwxrwxrwx 1 root root      19 Aug  4 05:27 libaccinj64.so -> libaccinj64.so.11.0
lrwxrwxrwx 1 root root      23 Aug  4 05:27 libaccinj64.so.11.0 -> libaccinj64.so.11.0.194
...
lrwxrwxrwx 1 root root      16 Aug  4 05:27 libcupti.so -> libcupti.so.11.0
lrwxrwxrwx 1 root root      20 Aug  4 05:27 libcupti.so.11.0 -> libcupti.so.2020.1.0
...

我在 Ubuntu 18.04 上。Nvidia GeForce RTX 2070 的工作站,并安装了 CUDA 版本 11。

nvidia-smi命令给了我这个:

+-----------------------------------------------------------------------------+
| NVIDIA-SMI 450.66       Driver Version: 450.66       CUDA Version: 11.0     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  GeForce RTX 2070    Off  | 00000000:02:00.0  On |                  N/A |
| 30%   40C    P2    58W / 185W |    693MiB /  7981MiB |      3%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+

我拥有的编译器(nvidia 和 portland)来自最新的 Nvidia HPC-SDK,版本 20.7-0

我用选项编译我的程序-acc -Minfo=accel,不知道如何设置-ta=以及是否需要它?

PS 我也不确定是否运行我的代码,无论是否nvprof使用 GPU,尽管我确实设置ACC_DEVICE_TYPEnvidia.

任何建议都会非常受欢迎。

干杯

4

1 回答 1

1

您使用的是哪个 nvprof?NV HPC 20.7 附带的还是您自己安装的?

这看起来与昨天在 NVIDIA DevTalk 用户论坛上报告的问题非常相似:

https://forums.developer.nvidia.com/t/new-20-7-version-where-is-the-detail-release-bugfix/146168/4

当然,这是针对 Nsight 系统的,但它可能是同一个问题。2020.3 版本的分析器似乎存在问题,这是我们随 NV HPC 20.7 SDK 一起提供的版本。正如我所指出的,Nsight-Systems 2020.4 版本应该已修复此问题,因此解决方法是下载并安装 2020.4 或使用之前的版本。

https://developer.nvidia.com/nsight-systems

Nsight-systems 下载似乎确实存在一个临时问题,希望在您看到此说明之前得到纠正。

此外,nvprof 正在被弃用,因此您应该考虑转而使用 Nsight-systems 和 Nsight-compute。

https://developer.nvidia.com/blog/migrating-nvidia-nsight-tools-nvvp-nvprof/

于 2020-09-24T15:54:13.953 回答