29

是否有任何开源音频指纹识别解决方案提供“类似 Shazam”的解决方案?

Shazam使用来自Landmark digital的商业解决方案,但我正在寻找一种替代方案(即使准确性和性能较差)开源解决方案。

任何人都知道这种实现,甚至是已发布的未实现算法吗?

4

5 回答 5

25
  • echoprint看起来像是商业库的可靠替代品。

语音识别:

我们只测试了 echoprint,到目前为止还不错。

我知道答案有点晚了,但是随着这个页面在谷歌中弹出,我们不妨随着时间的推移对其进行改进:)

编辑为 CMU 是面向语音的

于 2013-03-05T10:40:58.763 回答
13

有一些开源音频识别项目,虽然你可以忘记商业音频识别服务的质量/性能,如 Shazam、SoundHound 等。这也取决于你想要做什么样的识别(音频文件指纹/标记、实时识别、OTA(Over-The-Air)识别等)

开放式

  • AcoustID/MusicBrainz提供执行音频指纹识别和元数据关联(指纹和服务器)的工具。您可以建立自己的指纹/元数据服务器或使用 MusicBrainz 的服务。音频文件指纹识别的良好解决方案,不适用于实时高性能应用程序(即OTA)。我们还测试了它的音频流监控(广播监控),但结果很差。

  • Echoprint提供与 AcoustID 相同的工具(指纹和服务器+元数据),也可用于音频流监控,因为它可以准确识别从音频中任何位置获取的片段(但我不会将其用于严肃的商业应用) . 他们还声称它适用于 OTA 应用程序,但性能不适合生产用途。

  • Last.fm不是完全开源的,虽然他们已经开源了指纹模块。您必须查询他们的标识和元数据提供者服务,因为它们不提供完整的解决方案。

于 2015-01-27T01:28:43.553 回答
12

好的。不同的搜索关键字,我寻找的所有结果。

http://musicbrainz.org/doc/Audio_Fingerprint

感谢任何人观看

于 2011-06-07T17:47:23.730 回答
2

如果您正在寻找 .NET 中的解决方案,请查看SoundFingerprinting库。

它是开源的,建立在 Content Fingerprinting Using Wavelets 研究论文之上。

该算法与 Shazaam 的不同,但总体思路相似:从频谱中提取最显着的系数,然后使用它们构建指纹以供以后检索。

该算法的描述可以在这里找到。

于 2016-12-13T11:08:10.773 回答
1

如果您正在寻找 JAVA 库,请选择 MusicG,我在我过去的一个项目中使用过它,并且工作正常。 http://code.google.com/p/musicg/

于 2015-03-03T11:47:35.617 回答