我正在制作一个应用程序,当识别出拍手的声音时执行一个动作。我研究过简单地测量 AVAudioRecorder 的平均功率和峰值功率,这工作正常,但如果有其他声音,那么它会报告很多误报。我相信我需要某种音频指纹识别才能在其他音频播放时工作。现在我知道之前在 SO 上已经有人问过这个问题,但是大多数答案都说“使用 FFT”,然后这个人说“哦,好吧!” 但没有给出明确的解释,我仍然不知道如何使用 FFT 正确识别声音。
任何人都可以清楚地解释,引用另一个教程,或发布可以使用音频指纹识别声音的库的链接吗?
谢谢!