假设我想在不同的 CUDA 上下文(可能在不同的设备上)之间复制一些内存。CUDA 驱动程序 API为我提供:
cuMemcpyPeer
- 对于普通旧设备全局内存cuMemcpy3DPeer
- 用于 3D 阵列/纹理
但是二维数组似乎没有类似的 API 函数。为什么?还有——我该怎么办?我应该在两种情况下都通过普通的全局内存缓冲区吗?
PS - 异步副本的问题相同;我们涵盖了普通和 3D 案例,但没有 2D。
假设我想在不同的 CUDA 上下文(可能在不同的设备上)之间复制一些内存。CUDA 驱动程序 API为我提供:
cuMemcpyPeer
- 对于普通旧设备全局内存cuMemcpy3DPeer
- 用于 3D 阵列/纹理但是二维数组似乎没有类似的 API 函数。为什么?还有——我该怎么办?我应该在两种情况下都通过普通的全局内存缓冲区吗?
PS - 异步副本的问题相同;我们涵盖了普通和 3D 案例,但没有 2D。