c++ - CUDA 中的推力::device_vector

Question

我是 CUDA 新手，正在尝试学习用法。有人可以帮忙吗？我在主要功能中有以下内容（我在 Visual Studio 中，我的源文件和头文件分别是 .cu 和 .cuh）

 thrust::device_vector<float> d_vec(100);
 kernel<<<100,1>>>(d_vec);

然后在内核中我有

    template <typename T> __global__ kernel(thrust::device_vector<T> d_vec)
    {  int tid = threadIdx.x + blockIdx.x*blockDim.x;
       T xxx = 3.0;
       d_vec[tid] = xxx;
     }

我的目标是用 float 调用内核一次，用 double 调用内核一次。另请注意，在这个简单的示例中，我有变量 xxx （在我的实际情况下，它是一些产生双精度或浮点数的计算）。

我得到两个错误：1> 不允许从函数调用__host__函数（运算符 =）__global__2> 不允许从函数调用函数__host__（运算符 []）__global__

所以我猜“d_vec[tid] = ..”中的“[]”和“=”是问题所在。但我的问题是如何访问内核中的设备向量。有人可以澄清什么是正确的程序以及我做错了什么。提前致谢

score 5 · Accepted Answer

推力::device_vector 对象/引用不能用作内核参数。您可以使用原始指针来传递设备矢量数据。

thrust::device_vector<float> d_vec(100);
float* pd_vec = thrust::raw_pointer_cast(d_vec.data());
kernel<<<100,1>>>(pd_vec);

这是内核的原型

template <typename T> __global__ kernel(T* pd_vec)

优Q和这个类似。如何将推力::device_vector<int> 转换为原始指针

c++ - CUDA 中的推力::device_vector

1 回答 1

Related

Reference