3

我正在尝试FFT为一个项目进行设置,但实际上并没有清楚地了解事情......基本上,我正在使用Audio Units从设备的麦克风获取数据。然后我想FFT对这些数据做些什么。这是我目前所理解的:我需要为我的数据设置一个循环缓冲区。在每个填充的缓冲区上,我应用 aHann window然后执行FFT. 但是,我仍然需要一些关于重叠的帮助。为了获得更精确的结果,我知道我需要特别使用它,因为我正在使用窗口。但是,我在这方面找不到任何东西......这是我到目前为止所拥有的(用于音高检测):

// Setup -------------  
UInt32 log2N          = 10; // 1024 samples  
UInt32 N              = (1 << log2N);  
FFTSetup FFTSettings  = vDSP_create_fftsetup(log2N, kFFTRadix2);  
COMPLEX_SPLIT FFTData;  
FFTData.realp         = (float *) malloc(sizeof(float) * N/2);  
FFTData.imagp         = (float *) malloc(sizeof(float) * N/2);  
float * hannWindow = (float *) malloc(sizeof(float) * N);  

// create an array of floats to represent a hann window  
vDSP_hann_window(hannWindow, N, 0);

// FFT Time ----------  
// Moving data from A to B via hann window  
vDSP_vmul(A, 1, hannWindow, 1, B, 1, N);                                 

// Converting data in B into split complex form  
vDSP_ctoz((COMPLEX *) B, 2, &FFTData, 1, N/2);  

// Doing the FFT  
vDSP_fft_zrip(FFTSettings, &FFTData, 1, log2N, kFFTDirection_Forward);   

// calculating square of magnitude for each value  
vDSP_zvmags(&FFTData, 1, FFTData.realp, 1, N/2);  

// Inverse FFT  
vDSP_fft_zrip(FFTSettings, &FFTData, 1, log2N, kFFTDirection_Inverse);  

// Storing the autocorrelation results in B  
vDSP_ztoc(&FFTData, 1, (COMPLEX *)B, 2, N/2);  

vDSP_Length lastZeroCrosssing;  
vDSP_Length zeroCrossingCount;  
vDSP_nzcros(B, 1, N, &lastZeroCrossing, &zeroCrossingCount, N);  

// Cleanup -----------  
vDSP_destroy_fftsetup(FFTSettings);  
free(FFTOutput.realp);  
free(FFTOutput.imagp);  
free(hannWindow);

那么我将在哪里以及如何包含重叠?此外,任何代码片段都会更受欢迎。谢谢

更新:

这个项目的最终目标是对音频进行指纹识别,尽可能接近实时,所以我需要尽可能准确的结果——因此是重叠的。为此,我认为我实际上可以将所有部分从反向删除到清理。

4

1 回答 1

1

您实际上不需要重叠 - 通常帧重叠以在时间轴上提供更高的分辨率,例如用于绘制频谱图或用于估计音符开始时间。您现在可以让您的代码在不重叠的情况下工作,因为它不那么复杂,然后再决定您是否需要稍后在时间轴上获得更高的分辨率。

如果您决定确实要添加重叠,那么您将需要保存前一个缓冲区的一部分(例如 50%),然后对于每个新缓冲区,您将处理两个完整的缓冲区,如下所示:

  • 处理旧缓冲区的最后 50% + 新缓冲区的前 50%
  • 处理 100% 的新缓冲区
  • 为下一次迭代保存最后 50% 的新缓冲区

对于不同的重叠百分比,类似的逻辑适用。

请注意,将重叠增加超过某个点可能会适得其反,因为所需的处理带宽会大大增加而分辨率几乎没有增加。

于 2013-09-21T11:32:17.693 回答