Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我有巨大的矩阵,我希望矩阵的输出与输入矩阵的大小相同,只是每个单元格从相邻单元格中获取数字的总和。
你能指导我如何使用 CUDA 在 GPGPU 平台上处理它吗?
您必须将所有相邻单元格的值传递给您的内核(作为参数),这样您就可以求和。参数列表中的类似内容和之后的代码:( int actualCellvalue, int adj1, int adj2, int adj3 ...)
{ actualCellvalue = actualCellvalue + adj1 + adj2 + adj3 ....; }
这可能是错误的,但这就是我从您的简短描述中得出的结论。
问候,彼得