1

用 g++ 编译这个函数是可行的,但速度很慢。

void rota(double psir,double thetar,double phir,double xi,double yi,double zi,double *xf,double *yf,double *zf) {
  *xf = xi*cos(phir)*cos(psir)+yi*(-sin(phir)*cos(thetar)*cos(psir)+sin(thetar)*sin(psir))+zi*(sin(phir)*sin(thetar)*cos(psir)+cos(thetar)*sin(psir));
  *yf = xi*sin(phir)+yi*cos(phir)*cos(thetar)-zi*cos(phir)*sin(thetar);
  *zf = -xi*cos(phir)*sin(psir)+yi*(sin(thetar)*cos(psir)+cos(thetar)*sin(phir)*sin(psir))+zi*(cos(thetar)*cos(psir)-sin(thetar)*sin(phir)*sin(psir));
  return;
}

如果我计算一次中间值,然后调用它们,我的模拟运行更快。

void rota(double psir,double thetar,double phir,double xi,double yi,double zi,double *xf,double *yf,double *zf) {
  double cosf = cos(phir);
  double sinf = sin(phir);
  double cosp = cos(psir);
  double sinp = sin(psir);
  double cost = cos(thetar);
  double sint = sin(thetar);
  *xf = xi*cosf*cosp+yi*(-sinf*cost*cosp+sint*sinp)+zi*(sinf*sint*cosp+cost*sinp);
  *yf = xi*sinf+yi*cosf*cost-zi*cosf*sint;
  *zf = -xi*cosf*sinp+yi*(sint*cosp+cost*sinf*sinp)+zi*(cost*cosp-sint*sinf*sinp);
  return;
}

为什么 g++ 不为我做这个优化?有没有办法让我更有效地做到这一点?

谢谢!

4

1 回答 1

3

我已经使用gcc 4.7.2with编译了你的代码-O3。在这两种情况下,生成的x86_64程序集几乎相同。

然后,我通过调用它 100,000,000 次来对每个函数进行基准测试。

第一个版本采用:

real    0m0.216s
user    0m0.213s
sys     0m0.002s

而第二个花了:

real    0m0.216s
user    0m0.212s
sys     0m0.002s

得出你自己的结论。

于 2013-04-08T18:05:06.160 回答