问题标签 [audio-fingerprinting]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1134 浏览

android - Android如何检测烟雾报警器声音

我必须开发一个应用程序,我必须在其中使用麦克风收听声音。并且每当检测到烟雾警报声时,应用程序必须通知用户有火灾警报。为此,我正在考虑两种可能的解决方案

1 :) 使用 Speech To Text 识别器将烟雾警报声音转换为文本并存储该文本。并且在下一次收到烟雾警报声时,相同的 Speech To Text 识别器会将其转换为相关文本,如果该文本与存储的文本匹配,那么我认为它是警报声。

2:)存储报警声音,并通过比较波形将记录的声波与存储的声音匹配。这只是我的假设,因为我不是这些领域的专家。

到目前为止,我已经收集到这种声音匹配技术是通过audio fingerprinting即每个音频都有一个不同的指纹来完成的,如果我们能够匹配两个音频的指纹,那么它们被认为是相同的。

为此,我最近发现了以下链接

http://www.royvanrijn.com/blog/2010/06/creating-shazam-in-java/

http://masl.cis.gvsu.edu/2012/01/25/android-echoprint/

https://code.google.com/p/musicg/

这似乎更接近我的问题的解决方案。我仍在努力掌握所有这些,但大家的任何帮助都将受到广泛赞赏。

0 投票
1 回答
1465 浏览

python - 循环识别文件夹中的所有文件,使用 Dejavu 库进行音频指纹识别

有没有人有使用 Dejavu 库在 Python 中进行音频指纹识别和识别的经验?它工作正常,但我感兴趣的是,到目前为止,我一次只能识别一个文件:

任何人都知道如何以及在哪里创建一个循环,该循环将从上面对文件夹中的所有文件执行该打印命令?我认为应该在这里的某个地方创建循环:

https://github.com/worldveil/dejavu/blob/master/dejavu/recognize.py

我知道它应该使用 glob 模块完成,但由于我是新手,不知道将它与该循环放在哪里,所以我不会提示输入确切的文件以进行识别!

0 投票
2 回答
121 浏览

android - Android不断向服务器发送信息

我构建了一个类似的应用程序 Shazam,但它仅适用于发送 10 秒音频的整个文件。

我的疑问是:在 android 中,在播放音乐和搜索数据库时,有什么可以像 Shazam 一样保留的吗?还是它自己的 Shazam 服务技术?

0 投票
2 回答
1661 浏览

java - 如何使用音频指纹获取音频标签

我有一个所有 id3 标签为空的音频文件。我想提取声学指纹并使用在线服务来获取 id3 标签。

我怎样才能在 Java 中做到这一点?是否有在线服务可以让我通过音频指纹并返回标签?

0 投票
2 回答
270 浏览

ios - GNAudioSourceMic 原始音频位置

我目前正在开发一个应用程序,它使用 Gracenote 移动客户端来创建指纹并识别我正在听的音乐。我已经在我的项目中成功实现了它,但现在由于业务需求,我必须使用 Gracenote 录制的音频进行不同的处理。

关键是:由于 GNAudioSourceMic 封装了整个麦克风录制操作,例如 startRecording/stopRecording,所以我无法访问麦克风原始音频。

这是我正在使用的代码:

是否有人面临与上述相同的需求?

提前致谢

0 投票
1 回答
844 浏览

python - 用于音频混合拆分的 Python 模块

我已经搜索了很长时间,但没有找到任何真正有效的方法。
这个想法是我有一个音乐混合(主要是 .mp3),我正在尝试使用 pyechonest 来制作曲目列表来识别曲目。但是,这只会识别单个轨道(如果我错了,请纠正我),所以我想有另一个模块可以将混音分成单独的轨道。

我查看了 pydub 以进行音频拆分,但仍然存在检测问题。

提前致谢。

编辑:所以,我找到了一种剪切文件的方法,但现在 pyechonest 正在返回播客的名称而不是它自己的曲目名称,我的代码(例如 5 个部分):

显然不是我想要的......有什么方法可以强制 echonest 不查看播客,或者返回多种可能性或类似的东西?

0 投票
1 回答
926 浏览

android - 通过语音识别用户android

朋友们,

我正在尝试创建一个可以识别某人声音的应用程序。

这是一个可能的场景:

1) 用户(John)第一次启动应用程序,应用程序要求 John 创建一个语音密码(例如“Lock”)。2)约翰第二次启动应用程序说“锁定”--->成功!3) Mary 在 Johns 手机上启动应用程序并说“锁定”--> 访问被拒绝!

基本上通过他/她的声音来识别用户。

关于我如何解决这个问题的任何建议?我是安卓新手。是否有任何 publick api 已经做到这一点,我可以使用。

我知道 Android 中的 SpeechRecognizer 类可以识别语音,但它无法确定谁在说话。我需要的是音频指纹,这是 SpeechRecognizer 无法做到的(据我所知)。

0 投票
0 回答
1036 浏览

ios - 如何在 iOS 中检测拍手?

我正在制作一个应用程序,当识别出拍手的声音时执行一个动作。我研究过简单地测量 AVAudioRecorder 的平均功率和峰值功率,这工作正常,但如果有其他声音,那么它会报告很多误报。我相信我需要某种音频指纹识别才能在其他音频播放时工作。现在我知道之前在 SO 上已经有人问过这个问题,但是大多数答案都说“使用 FFT”,然后这个人说“哦,好吧!” 但没有给出明确的解释,我仍然不知道如何使用 FFT 正确识别声音。

任何人都可以清楚地解释,引用另一个教程,或发布可以使用音频指纹识别声音的库的链接吗?

谢谢!

0 投票
1 回答
197 浏览

java - Android /java echonest 文件上传errorrr

所以我一直试图弄清楚如何将文件上传到 echonest 服务器上进行分析,但我无法,实际上在 :Track track = echoNest.uploadTrack(file,true); 之后没有任何反应。

我在互联网上搜索时遇到了类似的问题,但我找不到解决方案。

http://archive-com.com/page/3694036/2014-02-11/http://developer.echonest.com/forums/thread/365

http://developer1072.rssing.com/chan-22893681/all_p31.html#item617

http://developer.echonest.com/forums/thread/1624

这是我收到的错误

0 投票
0 回答
145 浏览

matlab - 将音频信号划分为 Barks Band

我想在matlab中应用以下步骤

1) 读取音频数据

2)对该数据应用窗口函数

3)对窗口函数的结果应用fft

4)制作fft的功率谱

5) 将功率谱划分为 Barks 频带

我没有得到正确的波形,想绘制频谱,然后分成树皮带。