我有一系列媒体文件,主要是音乐,其中大部分是多年前从 CD 导入的。这个集合已经在不同的媒体播放器、不同的文件系统、不同的计算机等之间传输了很多次。在这个过程中,一些曲目被意外复制了。我还不断尝试整理这些元数据并正确标记所有内容,因为当大部分内容最初是导入时,我没有花哨的媒体播放软件,甚至没有意识到 ID3 标签表明一切都只是“经典专辑“Album”中的曲目 %d”。
这会产生这样一种情况,即我有一些具有最新元数据的文件,但是我想删除的同一媒体文件的“重复”,其元数据尚未正确更新。由于元数据存在于文件中,因此这些文件的内容现在有所不同,并且像liten2这样的工具不起作用。
我的问题是:是否有一个库可以方便地提取文件的媒体内容的唯一标识指纹(可能是某种加密哈希,但这不是硬性要求),而忽略元数据?如果是这样,我该如何使用它?