16

我可以将 C++ 对象复制到设备吗?

说我有:

class CudaClass
{
public:
int* data;
CudaClass(int x) {
    data = new int[1]; data[0] = x;
}
};

__global__ void useClass(CudaClass cudaClass)
{
    printf("%d" cudaClass.data[0]);
};


int main()
{
    CudaClass c(1);
}

现在如何将“c”复制到设备内存并启动内核“useClass”?

4

1 回答 1

21

是的,您可以将对象复制到设备以在设备上使用。当对象嵌入了指向动态分配区域的指针时,该过程需要一些额外的步骤。

有关所涉及内容的讨论,请参见我的回答。该答案还有一些与之相关的示例代码答案。

此外,在您的类定义中,如果您希望某些功能在设备上可用,您应该适当地装饰这些功能(即可能使用__device__ __host__);

编辑:为了回答一个问题(现已删除),这是我可以根据提供的代码提出的最简单的示例代码:

#include <stdio.h>

class CudaClass
{
public:
int* data;
CudaClass(int x) {
    data = new int[1]; data[0] = x;
}
};

__global__ void useClass(CudaClass *cudaClass)
{
    printf("%d\n", cudaClass->data[0]);
};




int main()
{
    CudaClass c(1);
    // create class storage on device and copy top level class
    CudaClass *d_c;
    cudaMalloc((void **)&d_c, sizeof(CudaClass));
    cudaMemcpy(d_c, &c, sizeof(CudaClass), cudaMemcpyHostToDevice);
    // make an allocated region on device for use by pointer in class
    int *hostdata;
    cudaMalloc((void **)&hostdata, sizeof(int));
    cudaMemcpy(hostdata, c.data, sizeof(int), cudaMemcpyHostToDevice);
    // copy pointer to allocated device storage to device class
    cudaMemcpy(&(d_c->data), &hostdata, sizeof(int *), cudaMemcpyHostToDevice);
    useClass<<<1,1>>>(d_c);
    cudaDeviceSynchronize();
    return 0;
}

为了简洁/清晰起见,我省略了通常的 cuda 错误检查。

回答这个问题,您不能使用基于设备的类中的指针直接从主机分配存储。这是因为 cudaMalloc 需要一个普通的基于主机的指针存储,例如你得到的:

int *hostdata;

cudaMalloc 无法使用其存储已在设备上的指针。这将不起作用:

cudaMalloc(&(d_c->data), sizeof(int));

因为它需要在主机代码中取消引用设备指针 (d_c),这是不允许的。

于 2013-04-15T20:41:19.237 回答