我想创建一个使用 AI 技术的应用程序,并允许用户录制歌曲的一部分,然后尝试在 wav 文件的数据库中找到该歌曲。
我本来希望将一些现有的库用于音频处理部分。那么,您能否推荐任何可以读取 wav 文件、从麦克风获取输入、具有一些音频过滤器(低通、高通、FFT 等)并且可能还能够绘制音频信号的库。
我更喜欢用 C# 开发,但如果没有好的音频处理库,我想我也可以用 C++ 工作。据我所知,Mathlab 已经具备上述功能,但我无法在我的应用程序中使用它。
我想创建一个使用 AI 技术的应用程序,并允许用户录制歌曲的一部分,然后尝试在 wav 文件的数据库中找到该歌曲。
我本来希望将一些现有的库用于音频处理部分。那么,您能否推荐任何可以读取 wav 文件、从麦克风获取输入、具有一些音频过滤器(低通、高通、FFT 等)并且可能还能够绘制音频信号的库。
我更喜欢用 C# 开发,但如果没有好的音频处理库,我想我也可以用 C++ 工作。据我所知,Mathlab 已经具备上述功能,但我无法在我的应用程序中使用它。
以FMOD为例,但不确定它是否可以满足您的所有需求。
我不知道任何可以处理短片段的公开可用的“音频指纹/匹配”库。有一个libfooid 项目,但我认为它需要您录制整首歌曲。此外,音频设备交互不是该库的一部分。您必须使用另一个库来录制音频数据。