问题标签 [audio-fingerprinting]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
448 浏览

python - 在 EchoPrint 上使用摄取/禁食时出现 400 错误请求错误

我正在执行以下操作以启动 codegen/server 以进行 echo print!

摄取代码位于http://pastebin.com/8iud70hD

我收到以下错误 -

0 投票
2 回答
2540 浏览

java - Real-time identification of non-speech, non-music sound from a continuous microphone stream

I'm looking to log events corresponding to a specific sound, such as a car door slamming, or perhaps a toaster ejecting toast.

The system needs to be more sophisticated than a "loud noise detector"; it needs to be able to distinguish that specific sound from other loud noises.

The identification need not be zero-latency, but the processor needs to keep up with a continuous stream of incoming data from a microphone that is always on.

  • Is this task significantly different than speech recognition, or could I make use of speech recognition libraries/toolkits to identify these non-speech sounds?
  • Given the requirement that I only need to match one sound (as opposed to matching among a library of sounds), are there any special optimizations I can do?

This answer indicates that a matched filter would be appropriate, but I am hazy on the details. I don't believe a simple cross-correlation on the audio waveform data between a sample of the target sound and the microphone stream would be effective, due to variations in the target sound.

My question is also similar to this, which didn't get much attention.

0 投票
2 回答
635 浏览

c++ - 从 32 位 Xcode 项目中引用 64 位静态库

我正在尝试构建一个 OpenFrameworks 项目,同时在 Xcode 中使用 C++ 中的 echoprint API。OpenFrameworks 需要在 i386 中构建,但 echoprint 在 x86_64 中构建。

是否可以从 32 位项目中引用 64 位静态库?如果是这样,我该如何在 Xcode 4 中执行此操作?

0 投票
4 回答
6504 浏览

java - 用于 Java/Android 的 echoprint 代码生成

有没有办法在 Android 上运行 echoprint-codegen 或者是否有 Java 实现?

github 上的 Echoprint 代码生成:https ://github.com/echonest/echoprint-codegen

它有一个 C++ 实现吗?我只是不知道如何将它移植到 Java,以便我可以在 Android 设备上运行它,假设是 Android 2.2 及更高版本。

0 投票
1 回答
428 浏览

java - 如何提取与给定音频剪辑对应的视频部分?

我有一个视频剪辑和一个从中提取的音频剪辑。如何将视频剪辑修剪到音频剪辑中提取的部分?

我想解决方案将包括:

  1. 自动识别视频剪辑中音频剪辑的开始位置和结束位置对(例如<03:05,09:55>);
  2. 从确定的开始到确定的结束修剪视频(这很容易)。
0 投票
1 回答
1986 浏览

c# - c# AudioFingerprinting 和 Locality Sensitive Hashing

我之前发现过类似的帖子,但没有什么能真正回答这个问题。

在我的指纹识别中,我生成了一个包含 5 个整数的记录集。例如:33,42,88,121,194

这些对应于对于特定音乐样本具有最高幅度的频率。例如:对于 30ms 的音频样本,我有以下频率的桶:

0-40

40-80

80-120

120-180

180-250

我试图产生一个散列(一个宽容的),它可能会为 33,42,88,121,194 产生与它所说的相同的散列

33,43,88,122,195

如果频率存在细微差异,则会形成类似的散列。

第一关是这个 LSH 吗?正如我所读到的,这最适合音频指纹识别。

如果没有,任何人都可以为可能做我正在寻找的功能提供一些伪代码或 c# 吗?我已经阅读了 LSH 和 matlab 和 perl 的实现,但我不理解它们,所以发布指向它们的链接不会对我有太大帮助。

再次感谢!

0 投票
1 回答
713 浏览

signal-processing - 开源音频功能(指纹)生成器

我已经从 Youtube 抓取了一些视频信息。现在我想用它的音频源给每个视频一个“特征标签”来加强我的视频推荐服务。是否有任何开源或免费的库/工具来做这样的工作?

我已经尝试了一些我发现的使用关键字“特征提取”的工具,例如“Maryas”中的“bextract”,但结果不是我想要的。

0 投票
1 回答
455 浏览

java - 提取歌曲标签

如何使用 java 从 mp3 文件中提取标签(专辑、艺术家、专辑封面等)?我需要将歌曲的所有标签存储在一个特定文件中,以便我可以将其用作数据库。

0 投票
2 回答
305 浏览

java - 提取频率发生的时间

我取了一个歌曲样本并对样​​本执行 FFT(快速傅里叶变换)。我能够获得歌曲的频率,但无法获得这些频率出现的时间。因此,它基本上变得无用,因为我必须将它与不同的样本进行匹配,除非我从中获得时间信息。

我该如何进行?

0 投票
1 回答
1139 浏览

freebsd - FreeBSD Echoprint 代码生成器

我正在尝试在 FreeBSD 上编译 Echoprint 代码生成,但失败了。但这是我尝试跑步时得到makemake install

我尝试以 root 和普通用户身份运行它。两者都无济于事。

不幸的是,我对makefile一无所知。FreeBSD有makefile吗?

最好的问候,蒂莫菲