2

我需要填写一个矩阵(size_out,size_in)。我一直在寻找类似的问题,但他们的解决方案都无法帮助我。

这是我的第一次尝试

for k= 0:size_out-1
    for n= 0:size_in-1
        part1= sincd(2*No-2, 2*size_in, (k+1/2)/factor -n -1/2);
        part3= sincd(2*No-2, 2*size_in, (k+1/2)/factor +n +1/2);
        part2= cos( (pi/(2*size_in) ) * ( (k+1/2)/factor -n -1/2) );
        part4= cos( (pi/(2*size_in) ) * ( (k+1/2)/factor +n +1/2) );
        A(k+1,n+1)= part1*part2+part3*part4;
    end
end

我通过消除内部循环来向量化这段代码:

for k= 0:size_out-1
    A(k+1,1:size_in)= ...
        sincd(2*No-2, 2*size_in, (k+1/2)/factor -(0:size_in-1) -1/2 ) .* ...
        cos( pi/(2*size_in) * ( (k+1/2)/factor -(0:size_in-1) -1/2 ) ) + ...
        sincd(2*No-2, 2*size_in, (k+1/2)/factor +(0:size_in-1) +1/2 ) .* ...
        cos( pi/(2*size_in) * ( (k+1/2)/factor +(0:size_in-1) +1/2 ) );
end

我的问题是:如何矢量化外循环?

我不确定 reshape&permute 或 bsxfun 的组合在这里是否有帮助。

提前致谢。

4

1 回答 1

0

由于一些参数和函数未定义,我冒昧地定义了它们。

很高兴看到“矢量化”带来了非常好的加速——尽管它的大部分可能是 MATLAB 并行化的。这有点滥用克朗,但这是一种方法。

加快剧情

注意这里的for循环是为了测试各种尺度

% // testing for a range of scales
t1 = [];
t2 = [];
scales = floor(logspace(1,3,20));
for scale = scales

    % // Some guessed parameters and large sizes
    size_out = scale;
    size_in = scale;
    No = 2; %?
    factor = 3;

    % // Arbitrary function for sincd
    sincd = @(x, y, z) x.*y.*z;

    tic
    % // Provided code
    A = zeros(size_out,size_in);
    for k= 0:size_out-1
        for n= 0:size_in-1
            part1= sincd(2*No-2, 2*size_in, (k+1/2)/factor -n -1/2);
            part3= sincd(2*No-2, 2*size_in, (k+1/2)/factor +n +1/2);
            part2= cos( (pi/(2*size_in) ) * ( (k+1/2)/factor -n -1/2) );
            part4= cos( (pi/(2*size_in) ) * ( (k+1/2)/factor +n +1/2) );
            A(k+1,n+1)= part1*part2+part3*part4;
        end
    end
    t1 = [t1; toc];



    tic

在这里,我使用克罗内克张量积来构建两个矩阵,其中包含行索引和列索引,后跟一个单位矩阵,这样进入 sincd 的所有内容都是相同的形状

    ns = kron([1:size_in]-1,ones(1,size_out)');
    ks = kron(ones(1,size_in),[1:size_out]'-1);
    ident = ones(size_out,size_in);

在这里,我只是用 ks 和 ns 替换了 k、n,以确保我保持操作元素明智且大小相同

    B =  sincd( 2*No-2*ident, 2*size_in*ident, (ks+1/2)/factor -ns -1/2) ...
        .* cos( (pi/(2*size_in) ) * ( (ks+1/2)/factor -ns -1/2) ) ...
      +  sincd(2*No-2*ident, 2*size_in*ident, (ks+1/2)/factor +ns +1/2) ...
         .*cos( (pi/(2*size_in) ) * ( (ks+1/2)/factor +ns +1/2) );

    t2 = [t2; toc];

    % // Should be zero
    norm(A-B)


end

loglog(scales, t1./t2)
title('speed up')
于 2012-12-11T12:12:38.810 回答