我有一个二维数组 $a,$ 存储在 device_vector 中,其索引 (p,i) 为 N 和 m
我要计算
$$s_{ij} = \sum \limits_{p=1}^{N} a_{p,i} a_{p,j}$$
for $i,j=1,...,m.$
有没有一种简单的方法可以使用推力来做到这一点?
上面的代码是乳胶的。在 C++ 中,它类似于
Matrix A(N,m); // filled with data
Matrix S(m,m);
for (int i=0; i <m;++i)
for (int j=0; j <m;++j)
{
S(i,j)=0;
for (int p=0; p < N; ++p)
S(i,j) += A(p,i)*A(p,j);
}