matlab - 向量与子矩阵的乘法很慢

Question

我有一个高矩阵（下面的例子是 10000×3000），我想用它的行的一个子集（例如，500 行）来取内积。使用不同的、随机选择的行多次重复此操作（示例中为 100 次，但实际上更多次）。事实证明，索引A(sub,:)相当慢。在我的示例中，最好乘以整个矩阵A（即 10000 行），而不是选择性地选择和乘以实际需要的 500。

行索引 ( sub = randperm(10000); sub = sub(1:500);) 的随机生成在计算上很便宜；为了公平起见，我把它放在两个循环中。

A=randn(10000,3000);
g=zeros(10000,1);

tic
for i=1:100
    sub = randperm(10000); sub = sub(1:500);
    b=randn(3000,1);
    g(sub) = g(sub) + A(sub,:)*b;
end
toc
% elapsed time is 1.58 sec

tic
for i=1:100
    sub = randperm(10000); sub = sub(1:500);
    b=randn(3000,1);
    g = g + A*b;
end
toc
% elapsed time is 1.28 sec

问题是：当实际只需要一部分行时，有没有办法加快速度？

score 1 · Accepted Answer

尝试乘以行而不是列。这可能需要您重新排列数据或应用一个.'或两个标量转置 ( )，但由于这是数组的原生形式，您可能会获得惊人的加速。例如，交换和的A尺寸g：

A = randn(3000,10000);
g = zeros(1,10000);

tic
for i = 1:100
    sub = randperm(10000,500);  % Taking @Dan's suggestion
    b = randn(1,3000);          % b is now a row vector
    g(sub) = g(sub)+b*A(:,sub); % multiply across rows instead
end
toc

如果需要，您可以转置输出。在我的电脑上，这比你的第一个案例快 50% 以上。

我相信至少其中一个根本原因是 BLAS/LAPACK在这种情况下可以使用循环展开。

matlab - 向量与子矩阵的乘法很慢

1 回答 1

Related

Reference