我能够读取 wav 文件及其值。我需要找到峰和坑的位置及其值。第一次,我尝试通过(i-1 + i + i +1) / 3
公式对其进行平滑,然后在数组上搜索作为array[i-1] > array[i] & direction == 'up' --> pits
样式解决方案,但由于噪声和其他项目未来计算的原因,我正在寻找更好的工作区域。几天以来,我一直在研究 FFT。据我了解,fft 将音频文件转换为一系列正弦和余弦。在 fft 操作之后,给定的值是a0
's 和a1
's fora0 + ak * cos(k*x) + bk * sin(k*x) which k++ and x++
就像这张图片
http://zone.ni.com/images/reference/en-XX/help/371361E-01/loc_eps_sigadd3freqcomp.gif
我的问题是,fft 是否有助于我找到音频的峰值和凹坑?有没有人有这种问题的经验?