2

我只想了解为什么快速反演算法比 math.h sqrt 函数慢。这是我的代码示例

代码试图演示比较慢反转和快速反转。在调试时,我看到慢速反转需要 1 秒,快速反转需要 4 秒。问题出在哪里?

    #include<stdio.h>
    #include<time.h>
    #include<math.h>
    #include"inverse.h"

    #define SIZE 256

    int main()
    {
       char buffer[SIZE];
       time_t curtime;
       time_t curtime2;
       struct tm *loctime;
       int i = 0;
       float x = 0;

       curtime = time(NULL);
       loctime = localtime (&curtime);
       fputs (asctime (loctime), stdout);

       while(i < 100000000)
       {
          i++;
          //x = 1/sqrt(465464.015465);
          x = inverse_square_root(465464.015465);
       }

       curtime = time(NULL);
       loctime = localtime (&curtime);
       fputs (asctime (loctime), stdout);

       getchar();
       return 0;
    }

    float inverse_square_root(float number)
    {
       long i;
       float x2, y;
       const float threehalfs = 1.5F;

       x2 = number * 0.5F;
       y  = number;
       i  = * ( long * ) &y;             // evil floating point bit level hacking
       i  = 0x5f3759df - ( i >> 1 );     // what the heck?
       y  = * ( float * ) &i;
       y  = y * ( threehalfs - ( x2 * y * y ) );   // 1st iteration
    // y  = y * ( threehalfs - ( x2 * y * y ) );   // 2nd iteration, this can be removed
       return y;
    }
4

3 回答 3

3

“问题”可能是您sqrt()现在拥有可以实现的硬件,使其比软件方法更快。如果没有更多关于您的系统的详细信息,也许还有一些分析和反汇编数据,很难说清楚。

fsqrt例如,有关 x86 指令的周期数的详细信息,请参阅此答案。

于 2014-03-14T15:51:26.223 回答
1

如果您真的想演示“慢”与“快”,您需要真正了解这两种算法的作用,因为没有特殊理由认为 sqrt() 很慢。编写自己的 slow_sqrt 函数。

于 2014-03-14T17:08:02.633 回答
1

这个问题相反,sqrt 或逆 sqrt 可能已经在 CPU 级别进行了优化。
进一步:您是否对具有最高优化级别的代码进行了基准测试?

奇数魔术常数利用 32 位 IEEE 浮点的表示,为牛顿迭代提取了一个很好的初始近似值。

于 2014-03-14T15:54:29.737 回答