我有一个高矩阵(下面的例子是 10000×3000),我想用它的行的一个子集(例如,500 行)来取内积。使用不同的、随机选择的行多次重复此操作(示例中为 100 次,但实际上更多次)。事实证明,索引A(sub,:)
相当慢。在我的示例中,最好乘以整个矩阵A
(即 10000 行),而不是选择性地选择和乘以实际需要的 500。
行索引 ( sub = randperm(10000);
sub = sub(1:500);
) 的随机生成在计算上很便宜;为了公平起见,我把它放在两个循环中。
A=randn(10000,3000);
g=zeros(10000,1);
tic
for i=1:100
sub = randperm(10000); sub = sub(1:500);
b=randn(3000,1);
g(sub) = g(sub) + A(sub,:)*b;
end
toc
% elapsed time is 1.58 sec
tic
for i=1:100
sub = randperm(10000); sub = sub(1:500);
b=randn(3000,1);
g = g + A*b;
end
toc
% elapsed time is 1.28 sec
问题是:当实际只需要一部分行时,有没有办法加快速度?