1

我知道如何将数组从主机复制到 GPU。但是,如果我有一个存储在主机上的列主矩阵,我想复制到 GPU 上的缓冲区,会发生什么情况。

还有其他方法可以在 forloop 中同时复制一个元素吗?

A_host [0 3 6 1 4 7 2 5 8]。

GPUBuffer = [0 1 2 3 4 5 6 7 8]。

4

1 回答 1

3

在这种情况下,如果矩阵足够大,您可能希望将其“按原样”发送到 GPU,并插入一个额外的转置内核(或将其合并到您的第一个内核)。

于 2013-03-16T03:05:17.987 回答