2

给定矩阵A 1 ,...,A nB 1 ,...,B n存储为gpuArray,我想计算矩阵C i =A i *B i

所有A i的大小相同,所有B i的大小相同(可能不同)。

假设n非常大并且矩阵的大小相对较小,我如何在 GPU 上快速执行此操作?是否可以避免使用 CUDA?

4

2 回答 2

2

如果您有 MATLAB R2013b,则可以使用新的 gpuArraypagefun函数。

于 2013-09-06T07:10:26.480 回答
1

如果AB属于 类gpuArray,则操作C = A*B将在 GPU 上执行,您无需执行任何其他操作。您不需要编写任何 CUDA。结果C也将是gpuArray,您可以使用 将其带回D本地工作区中的普通数组D = gather(C)

于 2013-08-07T14:08:30.027 回答