4

我有一个大型的旧音乐库(1920 年代、30 年代、40 年代等),其中有很多重复项,我想确定重复项并使用相同的 MP3 标签信息组织它们。由于音乐是不久前录制的,虽然它们听起来可能类似于人耳,但它们的录音实际上可能有点不同(更安静、更静态等)。

我目前正在解析一些音乐,pydub并且能够生成 wav 文件,消除歌曲开头和结尾的静音,并压缩音乐的动态范围,但我希望能够比较wav 文件,如果它们足够相似,我可以假设它们是相同的并给它们相同的标签。

是否有可能通过类似的方式运行 wav 文件数据,scipynumpy使用类似傅里叶变换/FFT 的方式以高精度比较/关联数据?我知道它可以使用类似的系统来完成,dejavu但它非常密集并且在数据库中使用大量存储空间,而且我可以访问原始文件而不是使用麦克风,所以我更愿意做一些更简单的事情。

4

1 回答 1

1

您需要音频哈希声学指纹。所有这些都是“密集型”(资源匮乏),因为它们必须解压缩音频并提取数据。

于 2017-06-11T12:46:57.330 回答