最近我开始在我的 iPhone 上使用Shazam 应用程序。对于那些不知道的人,这个应用程序通过听一小段正在播放的歌曲来识别歌曲。我对它的准确性和速度感到惊讶,所以我决定做一点挖掘。
我在这里找到了他们的一位开发人员写的一篇论文。在这篇论文中,开发人员详细介绍了 Shazam 中使用的指纹算法。
作为一个宠物项目,我想制作自己的歌曲指纹识别应用程序,这样我就可以获得一些音频编程的经验。
有哪些音频库可以帮助您提取音频剪辑或 mp3 歌曲在其持续时间内的频率、幅度和其他特征?
我正在使用 .NET,但我对其他语言库持开放态度。我对开源库和付费库都很好。只要我可以可靠地以编程方式提取音频特征,我就会很高兴。
另请参阅:
Shazam 的工作
原理 Shazam 期刊论文