当我尝试通过 Nvidia 的nvprof
分析器运行我使用 OpenACC 开发的程序时,我收到了主题中的消息,如下所示:
nvprof ./SFS 4
如果我运行nvprof
时-o [output_file]
未出现警告消息,但未创建输出文件。这里有什么问题?
LD_LIBRARY_PATH
设置在我的.bashrc
to:/opt/nvidia/hpc_sdk/Linux_x86_64/20.7/cuda/11.0/lib64/
因为我在那里找到了这些文件(它们的名称中有“cupti”和“inj”,我认为它们是需要的):
lrwxrwxrwx 1 root root 19 Aug 4 05:27 libaccinj64.so -> libaccinj64.so.11.0
lrwxrwxrwx 1 root root 23 Aug 4 05:27 libaccinj64.so.11.0 -> libaccinj64.so.11.0.194
...
lrwxrwxrwx 1 root root 16 Aug 4 05:27 libcupti.so -> libcupti.so.11.0
lrwxrwxrwx 1 root root 20 Aug 4 05:27 libcupti.so.11.0 -> libcupti.so.2020.1.0
...
我在 Ubuntu 18.04 上。Nvidia GeForce RTX 2070 的工作站,并安装了 CUDA 版本 11。
nvidia-smi
命令给了我这个:
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 450.66 Driver Version: 450.66 CUDA Version: 11.0 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|===============================+======================+======================|
| 0 GeForce RTX 2070 Off | 00000000:02:00.0 On | N/A |
| 30% 40C P2 58W / 185W | 693MiB / 7981MiB | 3% Default |
| | | N/A |
+-------------------------------+----------------------+----------------------+
我拥有的编译器(nvidia 和 portland)来自最新的 Nvidia HPC-SDK,版本 20.7-0
我用选项编译我的程序-acc -Minfo=accel
,不知道如何设置-ta=
以及是否需要它?
PS 我也不确定是否运行我的代码,无论是否nvprof
使用 GPU,尽管我确实设置ACC_DEVICE_TYPE
为nvidia
.
任何建议都会非常受欢迎。
干杯