我有一个简单的问题。是否可以使用 Alea.Gpu 编写这样的数组结构?
public struct SVDFactorsStructGpu
{
public deviceptr<float> ItemsBiases;
public deviceptr<float> UsersBiases;
public deviceptr<float> ItemsFeatures;
public deviceptr<float> UsersFeatures;
}
[...]
SVDFactorsStructGpu factors = new SVDFactorsStructGpu();
factors.ItemsBiases = gpuItemsBiases.Ptr;
factors.UsersBiases = gpuUsersBiases.Ptr;
factors.ItemsFeatures = gpuItemsFeatures.Ptr;
factors.UsersFeatures = gpuUsersFeatures.Ptr;
[...]
并以某种方式将它们传递给内核:
public void TrainEpochKernel(SVDParamsStructGpu svdParams,
deviceptr<float> ratings,
deviceptr<int> ratingsItemsIds,
deviceptr<int> userProfilesIds,
deviceptr<int> ratingsStartIdxs,
deviceptr<int> ratingsCounts,
deviceptr<float> userProfilesSSE,
SVDFactorsStructGpu factors)
{
int startUserProfileIdx = blockIdx.x * (blockDim.x * svdParams.StridePerThread) + threadIdx.x * svdParams.StridePerThread;
[...]
pred = svdParams.GlobalMean;
pred += factors.ItemsBiases[i];
pred += factors.UsersBiases[u];
[...]
这在没有结构的情况下工作,但在封装时会产生非法地址。
提前致谢
[edit #1] 似乎 Ptr 副本在这里是原因,就好像我尝试在内核签名中直接从结构中传递它们一样,错误是一样的。
[edit #2] 也许这是一个非常明显的问题,我尝试直接传递 DeviceMemory<> 但无法设置值。我将保留“一个数组版本的一个参数”,因为它并不重要,并且总体上得到了一个非常有效的算法。只是想了解更多关于 Alea.Gpu C# 的信息。