问题标签 [audio-fingerprinting]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - Real-time identification of non-speech, non-music sound from a continuous microphone stream
I'm looking to log events corresponding to a specific sound, such as a car door slamming, or perhaps a toaster ejecting toast.
The system needs to be more sophisticated than a "loud noise detector"; it needs to be able to distinguish that specific sound from other loud noises.
The identification need not be zero-latency, but the processor needs to keep up with a continuous stream of incoming data from a microphone that is always on.
- Is this task significantly different than speech recognition, or could I make use of speech recognition libraries/toolkits to identify these non-speech sounds?
- Given the requirement that I only need to match one sound (as opposed to matching among a library of sounds), are there any special optimizations I can do?
This answer indicates that a matched filter would be appropriate, but I am hazy on the details. I don't believe a simple cross-correlation on the audio waveform data between a sample of the target sound and the microphone stream would be effective, due to variations in the target sound.
My question is also similar to this, which didn't get much attention.
c++ - 从 32 位 Xcode 项目中引用 64 位静态库
我正在尝试构建一个 OpenFrameworks 项目,同时在 Xcode 中使用 C++ 中的 echoprint API。OpenFrameworks 需要在 i386 中构建,但 echoprint 在 x86_64 中构建。
是否可以从 32 位项目中引用 64 位静态库?如果是这样,我该如何在 Xcode 4 中执行此操作?
java - 用于 Java/Android 的 echoprint 代码生成
有没有办法在 Android 上运行 echoprint-codegen 或者是否有 Java 实现?
github 上的 Echoprint 代码生成:https ://github.com/echonest/echoprint-codegen
它有一个 C++ 实现吗?我只是不知道如何将它移植到 Java,以便我可以在 Android 设备上运行它,假设是 Android 2.2 及更高版本。
java - 如何提取与给定音频剪辑对应的视频部分?
我有一个视频剪辑和一个从中提取的音频剪辑。如何将视频剪辑修剪到音频剪辑中提取的部分?
我想解决方案将包括:
- 自动识别视频剪辑中音频剪辑的开始位置和结束位置对(例如<03:05,09:55>);
- 从确定的开始到确定的结束修剪视频(这很容易)。
c# - c# AudioFingerprinting 和 Locality Sensitive Hashing
我之前发现过类似的帖子,但没有什么能真正回答这个问题。
在我的指纹识别中,我生成了一个包含 5 个整数的记录集。例如:33,42,88,121,194
这些对应于对于特定音乐样本具有最高幅度的频率。例如:对于 30ms 的音频样本,我有以下频率的桶:
0-40
40-80
80-120
120-180
180-250
我试图产生一个散列(一个宽容的),它可能会为 33,42,88,121,194 产生与它所说的相同的散列
33,43,88,122,195
如果频率存在细微差异,则会形成类似的散列。
第一关是这个 LSH 吗?正如我所读到的,这最适合音频指纹识别。
如果没有,任何人都可以为可能做我正在寻找的功能提供一些伪代码或 c# 吗?我已经阅读了 LSH 和 matlab 和 perl 的实现,但我不理解它们,所以发布指向它们的链接不会对我有太大帮助。
再次感谢!
signal-processing - 开源音频功能(指纹)生成器
我已经从 Youtube 抓取了一些视频信息。现在我想用它的音频源给每个视频一个“特征标签”来加强我的视频推荐服务。是否有任何开源或免费的库/工具来做这样的工作?
我已经尝试了一些我发现的使用关键字“特征提取”的工具,例如“Maryas”中的“bextract”,但结果不是我想要的。
java - 提取歌曲标签
如何使用 java 从 mp3 文件中提取标签(专辑、艺术家、专辑封面等)?我需要将歌曲的所有标签存储在一个特定文件中,以便我可以将其用作数据库。
java - 提取频率发生的时间
我取了一个歌曲样本并对样本执行 FFT(快速傅里叶变换)。我能够获得歌曲的频率,但无法获得这些频率出现的时间。因此,它基本上变得无用,因为我必须将它与不同的样本进行匹配,除非我从中获得时间信息。
我该如何进行?
freebsd - FreeBSD Echoprint 代码生成器
我正在尝试在 FreeBSD 上编译 Echoprint 代码生成,但失败了。但这是我尝试跑步时得到make
的make install
我尝试以 root 和普通用户身份运行它。两者都无济于事。
不幸的是,我对makefile一无所知。FreeBSD有makefile吗?
最好的问候,蒂莫菲