python - 是否可以根据它们的 wav 文件比较两首相似的歌曲？

Question

我有一个大型的旧音乐库（1920 年代、30 年代、40 年代等），其中有很多重复项，我想确定重复项并使用相同的 MP3 标签信息组织它们。由于音乐是不久前录制的，虽然它们听起来可能类似于人耳，但它们的录音实际上可能有点不同（更安静、更静态等）。

我目前正在解析一些音乐，pydub并且能够生成 wav 文件，消除歌曲开头和结尾的静音，并压缩音乐的动态范围，但我希望能够比较wav 文件，如果它们足够相似，我可以假设它们是相同的并给它们相同的标签。

是否有可能通过类似的方式运行 wav 文件数据，scipy并numpy使用类似傅里叶变换/FFT 的方式以高精度比较/关联数据？我知道它可以使用类似的系统来完成，dejavu但它非常密集并且在数据库中使用大量存储空间，而且我可以访问原始文件而不是使用麦克风，所以我更愿意做一些更简单的事情。

score 1 · Accepted Answer

您需要音频哈希或声学指纹。所有这些都是“密集型”（资源匮乏），因为它们必须解压缩音频并提取数据。

python - 是否可以根据它们的 wav 文件比较两首相似的歌曲？

1 回答 1

Related

Reference