问题标签 [audio-fingerprinting]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
2040 浏览

python - Additional information for songs recognised by dejavu.py

I'm currently investigating dejavu.py (some more info), and I must say that I am quite impressed by it so far. Though I do find that the docs are a bit incomplete when it comes to user interfacing.
When you recognise a song from file with oDjv.recognize(FileRecognizer, sFile), you get returned a dictionary which looks like this:

And from recording (oDjv.recognize(MicrophoneRecognizer, seconds=iSecs)):

So, to the questions:
1) What exactly is confidence, and is there an upper bounds for the confidence level?

2) What is the difference between offset_seconds and offset?

3) Why does it take the algorithm somewhere between 30 and 60 seconds (in the case of all tests I ran) to identify the song from disk, but it can do it in 10 or so seconds when recording audio?

4) When running the function to record from audio, I get the following chunk of code preceding the actual output (even if successful) from the function. Where are we trying to go?

5) Is there an online music Database that I can just plug into the config?

0 投票
0 回答
631 浏览

c# - 在 Windows 10 (UAP) 上使用 AudioGraph 提取 PCM 数据以生成 Chromaprint 指纹

我目前正在尝试编写一个使用 chromaprint 来识别歌曲并从 acoustid.org 获取数据的 Win 10 应用程序。

但是我的 ExtractPCM-Methods 他们返回错误的值。第一个问题它返回到许多值。我有很多数据 246 秒 vs 237。第二个值由 fpcalc.exe 返回。

第二个问题是我的 ExtractPCM 实现返回的值与我在开源项目中找到的工作实现完全不同。我不太了解音频,但我认为我的价值观是绝对错误的。

我用来测试我的代码的参考实现是AresRpg。它使用 BASS 来提取 PCM 数据。

数据 BASS 返回以 10.054 个零开始,然后继续:

-1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 -1 -1 0 0 0 -1 0 0 0 0 0 0 0 0 0 0 0 -1 - 1 0

两秒标记末尾的最后一个值如下所示:

612 627 635 647 655 656 662 662 663 658

我的实现从 10.528 个零开始,然后是:

-15194 11946 21344 12111 25732 12414 -28715 12748 6098 12973 -31198 13046 28784 12844 21248 12797 1592 13165 22544 13294 -20448

并以

13636 -17580 -18770 -17639 -29613 -17604 10168 -17608 20472 -17618

我的 ExtractPCM 看起来像

AresRPG 使用以下代码读取数据:

编辑

我将不安全块更改为以下内容:

这是因为即使 SubType 不是浮点数,用于存储数据的格式也是浮点数。

现在我得到了我认为是这首歌的数据(我作为一个人),但仍然有一些事情发生了:(

我的提取时间稍长,声音也更大。因此,同时播放两个版本的开始似乎是同步的,但在您听到两个曲目以不同的速度播放之后不久。最后相差一秒左右。我认为音量不会影响指纹,但我的解码速度较慢可能会有所不同。

我用来测试的样本是来自 Adele 的 Rolling Deep,该样本将由 acousticid.org 识别。但我认为我不允许发布编辑后的版本。

所以我使用了这首 cc Song并创建了一个wav 文件,其中我的解码在左侧 chanel 中,而 Ares 在右侧 chanel 中解码。

可惜这首歌不在 acusticId 数据库中,至少我找不到指纹。

0 投票
1 回答
496 浏览

python - Python - audiodiff 找不到存在的文件

我正在比较 wav 文件,这个脚本运行良好,直到我切换到 LMDE Betsy。给我错误的功能是:

我的第一个想法是它试图两次打开同一个文件,但w.src_path != arg_wav.src_path应该考虑到这一点。我得到这个输出:

从我的功能:

追溯:

奇怪的是它昨天在 Linux Mint 17.1Windows 7 上运行。这是我不知道的一些奇怪的 Debian 约定吗?是的,我仔细检查了两个文件都存在于所描述的路径中。

0 投票
0 回答
79 浏览

ios - 如何通过使用 Echonest for iOS 收听来识别歌曲?

我想实现一种类似于 Shazam 应用程序中集成的功能。我希望我的应用程序通过按下一个按钮来“收听”一首歌曲,并在一段时间后“猜测”这首歌或使用 iOS 的 Echonest api 给出一些预测。我在网上搜索,到目前为止我已经了解到我需要将指纹发送到 Echonest 服务器并用歌曲信息给我回复。但是在某处我读到该功能将不再可用。还尝试将整个 mp3 文件上传到他们的服务器,但响应始终为空。有没有人有这个问题的经验并告诉我我错在哪里?我使用了 echoprint但没有成功。

0 投票
0 回答
959 浏览

android - 用于音频输入的 Musicg 指纹

在 musicg 中,我可以通过以下代码比较 Wave 文件的指纹:

我可以直接输入 MIC 输入来获取指纹相似度,而不是保存音频和比较?

例如:

编辑:在 Wave.java 中,函数 initWaveWithInputStream() 我可以将 feed MIC 输入作为 Inputstream 发送吗?可能吗 ?

0 投票
1 回答
431 浏览

windows - echoprint 指纹生成 Windows vs Linux

我曾经在 Windows 7-64bit 和 Ubuntu 上为音频文件生成指纹,但指纹代码不一样(我的意思是代码字段。)。我使用编译的 Windows 源代码。它应该不一样还是我做错了什么。

更新

Windows
C:\ecoprint\codegen.exe Kalimba.mp3 > code.txt
Ubuntu
/home/regata/echoprint-codegen$ ./echoprint-codegen Kalimba.mp3 > code.txt

samples_decodedcode_count字段不同,当然代码部分也不同。

0 投票
1 回答
375 浏览

audio-fingerprinting - 如何使用 curl 查询 echoprint 本地服务器?

我对 echonest 和 curl 很陌生。我有一个正在运行的 echoprint 服务器,并且 echoprint codegen 也可以正常工作。我可以使用摄取方法将代码推送到我的本地服务器。

但我不知道如何使用 curl 请求查询服务器。

如何发送用于查询 echoprint 服务器的 curl 请求的语法或示例?

0 投票
1 回答
207 浏览

algorithm - 使用 Echonest 从音频生成音频指纹

如何使用Echonest 库生成音频指纹?

0 投票
1 回答
310 浏览

ios - Unreadable Offline DB files of ACRCloud Music Recognition SDK

Pls help,

I'm using ACRCloud's Music Recognition iOS SDK for offline recognition in movie theatre like Shazam. After uploading audio files and downloaded the Offline DB file, I got this error:

How can I solve this problem, Im beginner

0 投票
2 回答
744 浏览

ads - 是否有任何用于广播广告监控的音频指纹识别服务?

我们有一个无线电监控产品,可以帮助我们的客户监控他们的输出(广告)和他们的竞争对手。

现有的系统/工具基于无线电的EPG信息和所涉及的人员,因此可靠性是一个问题。

所以我主要看这个是为了增加我们现有产品的稳健性。

我知道音频指纹技术可以解决这个问题。有没有支持自传内容和识别(监控)的服务?

任何建议将不胜感激。