1

我已经使用 mex 和 it++ 在 C 中重写了我的 MATLAB 函数,但是我的 mex 实现比我的 MATLAB 函数慢很多。我想知道是否有人可以告诉我我做错了什么。MATLAB

for idx = 1:length(eps_r)
    if (idx == 1) || (eps_r(idx) ~= eps_r(idx-1))
        v_p     = c/sqrt(eps_r(idx)); % m/s - Propogation Velocity
        dz      = v_p*dt/2;
        k       = 2*w/v_p; % rad/m
        z_shift = exp(1i*dz*sqrt((repmat(k,1,size(data,2))).^2-(repmat(kx,size(data,1),1)).^2));
    end

    fk_data(idx,:) = ifft(mean(data))*exp(-1i*2*pi*freq(1)*time(idx));
    data    = data.*z_shift;
end

墨西哥与 IT++

 for(int idx = 0; idx < eps_r.size();  idx++ )
 {
     if ( (idx == 1) || (eps_r(idx) != eps_r(idx-1) ) )
     {
         v_p =  2.9979e+08 / sqrt(eps_r(0));

         dz = v_p * time(0)/2;
         k = 2 * w / v_p;

         for(int y = 0 ; y < z_shift.size(); y++) 
             z_shift(y) = exp(dz * i * sqrt(pow(z_shift_pt1(y),2) - pow(z_shift_pt2(y),2)));
     }

     fk_data =  ifft(complex_mean(data)) * exp(-i * 2 * itpp::pi * freq(0) * time(idx));
     data = elem_mult(data,z_shift);

}

}
4

1 回答 1

1

IFFT有多大?如果这是代码花费大部分时间的地方,那么您不能期望移植到 C++ 会显着提升。IT++ FFT 函数本身的文档指出库的内存管理不是最佳的,直接调用 FFTW 可能会更快。另一方面,在调用此类基本函数时,Matlab 进行了高度优化。

Matlab 的最新版本基于即时 (JIT) 编译,并且可能比简单的 C++ 实现更好。

[最后,我相信 IT++ 并不是最快的 C++ 矩阵库。根据您的用例,您可能会更快地找到犰狳或 Eigen]。

于 2012-12-03T20:55:48.530 回答