我有一个关于 CUDA 感知 MPI 和 GPUDirect 的问题。我正在写一篇论文,其中我相信我正在使用 GPUDirect,但一位审稿人评论说我只使用了支持 CUDA 的 MPI。在我使用的集群上,我安装了 CUDA 8.0.61、PGI 18.1 和 MVAPICH2-GDR/2.3b,并且在 OpenACC 代码中我使用 host_data use_device 在节点内的 GPU 之间直接发送/接收缓冲区(据我所知GPUDirect RDMA 在我目前的情况下不起作用,但我也知道 GPUDirect 有很多级别,它是一个 umbralla 词)。
有人可以对此提供一些想法吗?谢谢!
最好的,