我有一个大型的旧音乐库(1920 年代、30 年代、40 年代等),其中有很多重复项,我想确定重复项并使用相同的 MP3 标签信息组织它们。由于音乐是不久前录制的,虽然它们听起来可能类似于人耳,但它们的录音实际上可能有点不同(更安静、更静态等)。
我目前正在解析一些音乐,pydub
并且能够生成 wav 文件,消除歌曲开头和结尾的静音,并压缩音乐的动态范围,但我希望能够比较wav 文件,如果它们足够相似,我可以假设它们是相同的并给它们相同的标签。
是否有可能通过类似的方式运行 wav 文件数据,scipy
并numpy
使用类似傅里叶变换/FFT 的方式以高精度比较/关联数据?我知道它可以使用类似的系统来完成,dejavu
但它非常密集并且在数据库中使用大量存储空间,而且我可以访问原始文件而不是使用麦克风,所以我更愿意做一些更简单的事情。