0

作为一个个人项目(为了更好地学习 python),我开始研究一个重复文件删除器(特别是对于 .mp3 文件,因为我在尝试组织我的完全重复的音乐收藏时想到了它)。现在,我非常清楚如何继续,匹配文件名并仅提供删除那些具有超过 0.7 相似性比率的文件,并对那些相同但名称完全不同的文件使用 md5 总和(例如:“metallica - 其他都不重要”和“Track1”)。问题是我不知道如何处理那些具有不同名称并且它们彼此有点不同的文件,例如,“没有其他问题”和“Track1”是相同的,除了“ Track1" 结束时有 2 秒的静音。我的问题是:是否有某种方法或算法可以检查文件本身之间的相似性?像字符串匹配但在文件上的东西?不管它是否是一个复杂的算法,越难越好,因为我这样做只是为了学习:D

4

2 回答 2

4

您可以使用Chromaprint来计算一段音乐的指纹。它应该能够找到类似的音乐文件。

如果您想进一步推动这一点,您可以使用musicbrainz的 api来查找有关一首音乐的确切信息。

这些库用于我使用的两个伟大的音乐库标记和排序应用程序:picardbeets

于 2012-05-31T13:35:12.507 回答
0

你也可以看看win32模块,这里是链接

http://timgolden.me.uk/python/index.html

于 2012-05-31T15:30:12.680 回答