cuda - 是否可以通过新 CUDA6 中的简单指针从 CPU 内核访问 GPU-RAM？

Question

现在，如果我使用此代码尝试通过在 GeForce GTX460SE (CC2.1) 中使用 CUDA5.5 从 CPU 内核访问 GPU-RAM，那么我会收到异常“访问冲突”：

#include "cuda_runtime.h"
#include "device_launch_parameters.h"

#include <iostream>

int main()
{
    unsigned char* gpu_ptr = NULL;
    cudaMalloc((void **)&gpu_ptr, 1024*1024);

    *gpu_ptr = 1;

    int q; std::cin >> q;
    return 0;
}

但是我们知道，有UVA（统一虚拟寻址）。还有一些新的：

2013 年 10 月 25 日 - 331.17 Beta Linux GPU 驱动程序：新的 NVIDIA 统一内核内存模块是一个新的内核模块，用于统一内存功能，将在即将发布的 NVIDIA CUDA 中公开。新模块是 nvidia-uvm.ko，它将允许 GPU 和系统 RAM 之间的统一内存空间。http://www.phoronix.com/scan.php?page=news_item&px=MTQ5NDc
CUDA 6 的主要特性包括：统一内存——通过使应用程序能够访问 CPU 和 GPU 内存而无需手动将数据从一个内存复制到另一个，从而简化了编程，并且可以更轻松地在广泛的范围内添加对 GPU 加速的支持编程语言。http://www.techpowerup.com/194505/nvidia-dramatically-simplifies-parallel-programming-with-cuda-6.html

是否可以通过使用新 CUDA6 中的简单指针从 CPU 内核访问内存 GPU-RAM？

score 8 · Accepted Answer

是的，CUDA 6 中的新unified memory功能将使在 Kepler 设备及其他设备上（因此不在您的 Fermi GPU 上）在主机和设备代码之间共享指针成为可能。

为了实现这一点，您需要使用 Kepler 设备（如 cc 3.0 或 3.5）和新的cudaMallocManagedAPI。这将在 CUDA 6.0 正式可用时进一步记录，但与此同时，您可以在此博客中阅读更多相关信息，其中包括示例。

这种机制不会神奇地导致 PCI Express 总线的影响消失，因此实际上正在发生的事情是“在幕后”制作了两个数据副本，并且cudaMemcpycuda 运行时会根据需要自动安排操作。还有很多其他的实现问题需要注意，现在我建议阅读博客。

请注意，统一内存 (UM) 与统一虚拟寻址 (UVA) 不同，后者自 CUDA 4.0 起就可用并已记录在案。

cuda - 是否可以通过新 CUDA6 中的简单指针从 CPU 内核访问 GPU-RAM？

1 回答 1

Related

Reference