0

我是一名从事电信项目的计算机程序员。
在我们的项目中,我必须将一系列复数更改为他们的傅立叶变换。所以我需要一个有效FFT的标准代码C89
我正在使用以下代码,它运行良好:

    short FFT(short int dir,long m,double *x,double *y)
{
   long n,i,i1,j,k,i2,l,l1,l2;
   double c1,c2,tx,ty,t1,t2,u1,u2,z;

   /* Calculate the number of points */
   n = 1;
   for (i=0;i<m;i++) 
      n *= 2;

   /* Do the bit reversal */
   i2 = n >> 1;
   j = 0;
   for (i=0;i<n-1;i++) {
      if (i < j) {
         tx = x[i];
         ty = y[i];
         x[i] = x[j];
         y[i] = y[j];
         x[j] = tx;
         y[j] = ty;
      }
      k = i2;
      while (k <= j) {
         j -= k;
         k >>= 1;
      }
      j += k;
   }

   /* Compute the FFT */
   c1 = -1.0; 
   c2 = 0.0;
   l2 = 1;
   for (l=0;l<m;l++) {
      l1 = l2;
      l2 <<= 1;
      u1 = 1.0; 
      u2 = 0.0;
      for (j=0;j<l1;j++) {
         for (i=j;i<n;i+=l2) {
            i1 = i + l1;
            t1 = u1 * x[i1] - u2 * y[i1];
            t2 = u1 * y[i1] + u2 * x[i1];
            x[i1] = x[i] - t1; 
            y[i1] = y[i] - t2;
            x[i] += t1;
            y[i] += t2;
         }
         z =  u1 * c1 - u2 * c2;
         u2 = u1 * c2 + u2 * c1;
         u1 = z;
      }
      c2 = sqrt((1.0 - c1) / 2.0);
      if (dir == 1) 
         c2 = -c2;
      c1 = sqrt((1.0 + c1) / 2.0);
   }

   /* Scaling for forward transform */
   if (dir == 1) {
      for (i=0;i<n;i++) {
         x[i] /= n;
         y[i] /= n;
      }
   }

   return(true);
}

但是这段代码,只支持2^m.like CLRSbook 代码大小的数组。
我们应该转换的数组不在此范围内,并且添加零会很昂贵,因此我正在寻找另一种解决方案来帮助我输入任何大小。
比如什么IT++matlab做什么。但是因为我们希望在纯 C 中使用它们是不可能的。此外,IT++在我检查时代码被阻止了

4

3 回答 3

2

如果您正在使用任何大众市场计算平台(带有 Windows 或 OS X、iOS 等的英特尔),那么供应商或制造商会提供高性能 FFT 实现。

否则,您应该评估FFTW

为非 2 的幂次方编写高性能 FFT 是一项复杂的任务。

如果您要使用自己的实现,那么,仅关于两个大小的幂:

您展示的实现sqrt在 FFT 期间进行计算。大多数高性能 FFT 实现会提前计算常数并将它们存储在表中。

缩放包含除法运算, inx[i] /= ny[i] /= n。编译器很可能将这些实现为除法指令。除法通常是普通处理器上的慢指令。最好计算scale = 1. / n一次并乘以scale而不是除以n

更好的是完全省略刻度。变换通常在没有比例的情况下很有用,或者可以从单个变换中省略比例并作为聚合比例仅应用一次。(例如,不要进行两次缩放操作,一次在正向 FFT 中,一次在反向 FFT 中,将缩放操作从 FFT 例程中排除,并在正向 FFT 和反向 FFT 之后只执行一次。)

如果可以接受以位反转顺序的频域数据,则您可以省略位反转排列。

如果保持位反转排列,则可以对其进行优化。执行此操作的技术取决于平台。某些平台具有用于反转整数中的位的指令(例如,ARM 具有rbit)。如果您的平台没有,您可能希望将位反转索引保留在一个表中,或者研究比当前代码更快地计算它们的方法。

如果同时保留位反转排列和缩放,则应考虑同时进行。排列使用大量内存运动,缩放使用处理器的算术单元。大多数现代处理器可以同时完成这两项工作,因此您将从重叠操作中获得一些好处。

您当前的代码使用 radix-2 蝴蝶。Radix-4 通常更好,因为它从乘以 i 的事实中获得了一些优势,只需更改使用的数据片段并将一些加法更改为减法,反之亦然。

如果您的数组长度接近处理器上一级内存缓存的大小,则 FFT 实现的部分内容将破坏缓存并显着减慢,除非您设计适当的代码来处理这个问题(通常通过将数组的一部分临时复制到缓冲区中)。

如果您的目标处理器具有 SIMD 功能,则绝对应该使用 FFT 中的功能;它们极大地提高了 FFT 性能。

以上应该告诉您编写高效的 FFT 是一项复杂的任务。除非您想在它上面花费大量精力,否则最好使用 FFTW 或其他现有实现。

于 2013-08-20T18:50:16.710 回答
0

对于 FFTW 的替代方案,请查看我的 mix-radix FFT,它也可以处理非 2^N FFT 长度。C 源代码可从http://www.corix.dk/Mix-FFT/mix-fft.html获得。

于 2015-01-10T22:36:49.523 回答
0

在您的实现中,我担心这段代码:

     z =  u1 * c1 - u2 * c2;
     u2 = u1 * c2 + u2 * c1;
     u1 = z;

(u1, u2) 在较大时l1会产生大量累积舍入误差。您可能会得到不准确的转换。

我会赞同 FFTW 的建议,但我相信它是高度特定于平台的。(大多数 FFT 库都是。) [编辑:不,它实际上是直接的 C89。这正是你所说的你正在寻找的东西。]

Wikipedia FFT 页面列出了一系列适用于奇怪大小的输入数组的算法。我不知道它们是如何工作的,但我相信一般的想法是您使用Rader 算法Bluestein 算法来处理素数大小的输入,并使用Cooley-Tukey将复合大小的变换减少为一堆素数大小的变换。

于 2013-08-20T18:28:30.100 回答