1

我正在尝试优化我的代码的性能(例如速度)。我是矢量化的新手,并尝试自己进行矢量化,但没有成功(也尝试 bxsfun、parfor、某种矢量化等)。谁能帮我优化这段代码,以及如何做到这一点的简短描述?

% for simplify, create dummy data
Z = rand(250,1)
z1 = rand(100,100)
z2 = rand(100,100)

%update missing param on the last updated, thanks @Bas Swinckels and @Daniel R
j = 2;
n = length(Z);
h = 0.4;


tic
[K1, K2] = size(z1);
result = zeros(K1,K2);

for l = 1 : K1
    for m = 1: K2
        result(l,m) = sum(K_h(h, z1(l,m), Z(j+1:n)).*K_h(h, z2(l,m), Z(1:n-j)));    
    end
end

result = result ./ (n-j);
toc

K_h.m 函数是边界核,定义为(x 是标量,y 可以是向量)

function res = K_h(h, x,y)
 res = 0;

 if ( x >= 0 & x < h)
    denominator = integral(@kernelFunc,-x./h,1);  
    res = 1./h.*kernelFunc((x-y)/h)/denominator;
 elseif (x>=h & x <= 1-h)
    res = 1./h*kernelFunc((x-y)/h);
 elseif (x > 1 - h & x <= 1)
    denominator = integral(@kernelFunc,-1,(1-x)./h);
    res = 1./h.*kernelFunc((x-y)/h)/denominator;
 else    
    fprintf('x is out of [0,1]');
    return;
 end
end

需要很长时间才能得到结果: \Elapsed time 为 13.616413 秒。

谢谢你。欢迎任何意见。P/S: 对不起我的英语不好

4

1 回答 1

0

一些观察:似乎Z(j+1:n))Z(1:n-j)在循环内是恒定的,所以在循环之前进行索引操作。接下来,看起来循环真的很简单,每个都result(l, m)依赖于z1(l, m)and z2(l, m)。这是使用arrayfun的理想情况。解决方案可能看起来像这样(未经测试):

tic

% do constant stuff outside of the loop
Zhigh = Z(j+1:n);
Zlow = Z(1:n-j);

result = arrayfun(@(zz1, zz2) sum(K_h(h, zz1, Zhigh).*K_h(h, zz2, Zlow)), z1, z2)

result = result ./ (n-j);
toc

我不确定这是否会快很多,因为我猜运行时间不会由 for 循环支配,而是由K_h函数内部完成的所有工作支配。

于 2013-11-07T22:05:33.053 回答