0

我正在尝试为具有sm_10不支持malloc__global__函数调用的架构的 GPU 编译我的 CUDA C 代码。

我需要保留一棵树,在 GPU 内存中为其动态创建节点。不幸的是,没有malloc显然我不能这样做。

有没有办法使用复制整个树cudaMalloc?我认为这种方法只会复制我的树的根。

4

1 回答 1

3

引用 CUDA C 编程指南

动态全局内存分配和操作仅受计算能力 2.x 及更高版本的设备支持。

对于早于2.0的计算能力,唯一的可能性是:

  1. 从主机端使用在函数cudaMalloc中分配尽可能多的全局内存;__global__
  2. 如果您在编译时知道所需的内存大小,请使用静态分配;
于 2013-09-26T21:13:31.600 回答