0

我有巨大的矩阵,我希望矩阵的输出与输入矩阵的大小相同,只是每个单元格从相邻单元格中获取数字的总和。

你能指导我如何使用 CUDA 在 GPGPU 平台上处理它吗?

4

1 回答 1

1

您必须将所有相邻单元格的值传递给您的内核(作为参数),这样您就可以求和。参数列表中的类似内容和之后的代码:( int actualCellvalue, int adj1, int adj2, int adj3 ...)

{ actualCellvalue = actualCellvalue + adj1 + adj2 + adj3 ....; }

这可能是错误的,但这就是我从您的简短描述中得出的结论。

问候,彼得

于 2011-05-05T16:30:29.067 回答