2

我正在尝试在 CUDA 中使用我的 c++ 类。

我有这样的课程:

#include<string>
#include<stdlib.h>

class exampleClass{
int i;
__host__ __device__ exampleClass(int _i):i(_i){};
__host__ __device__ void increment(){i++;}
__host__ __device__ string outputMessage(return itoa(i);}

};

我已将其设置在 .cu 文件中并设置为编译 CUDA c/c++

这无法使用 nvcc 编译,因为 cuda 没有字符串。

我想做的是通过执行以下操作保留仅 CUDA 的功能:

#ifndef __CUDA_ARCH__
  #include<string>
#endif
    #include<stdlib.h>

    class exampleClass{
    int i;
    __host__ __device__ exampleClass(int _i):i(_i){};
    __host__ __device__ void increment(){i++;}
#ifndef __CUDA_ARCH__
     string outputMessage(return itoa(i);}
#endif

    };

但我知道这不起作用……至少,它对我不起作用。nvcc 不喜欢包含字符串,也不喜欢需要字符串类型的函数。

如果示例不是一流的,请道歉。总之,我想做的是让核心类成员在 CUDA 上可执行,同时保持在主机端进行花哨的主机操作以进行分析和输出的能力。

更新:我的最终目标是拥有一个基类,其中包含几个指向多个多态类的指针类型。这个基类本身将是可派生的。我认为这在 CUDA5.0 中是可能的。我弄错了吗?

4

1 回答 1

2

以下代码构建,虽然我没有运行它:

class exampleClass{
int i;
public:
__host__ __device__ exampleClass(int _i):i(_i){};
__host__ __device__ void increment(){i++;}

 __host__ string outputMessage(){ return "asdf";}


};

__global__ void testkernel (                        
    exampleClass *a,
    int IH, int IW)
{
    const int i = IMUL(blockIdx.x, blockDim.x) + threadIdx.x;
    const int j = IMUL(blockIdx.y, blockDim.y) + threadIdx.y;


    if (i<IW && j<IH) 
    {
        const int i_idx = i + IMUL(j, IW);  
        exampleClass* ptr = a+i_idx;
        ptr->increment();
    }
}

__host__ void test_function(exampleClass *a,
    int IH, int IW)
{
    for (int i = 0; i < IW; i++)
        for (int j = 0; j < IH; j++)
        {
            const int i_idx = i + j*IW;
            exampleClass* ptr = a+i_idx;
            cout << ptr->outputMessage();
        }
}

请注意,您必须将类从设备移动到主机内存才能正常“工作”。如果您尝试对类做任何花哨的事情(例如多态性),这可能会失败。

于 2013-03-28T20:16:30.290 回答