问题标签 [audio-analysis]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
245 浏览

audio - 如何从 PRAAT 中的 .wav 文件中自动提取音高范围并将它们全部放入 .csv 文件中?

我正在使用 PRAAT,我需要提取音高范围。我的音频文件都不到 2 秒,而且我有十几个。我只知道在单击时获取信息现在,我从在原始音频文件上单击提取可见音高轮廓后获得的音高对象中手动提取音高范围(查询 > 音高信息)。

0 投票
0 回答
101 浏览

audio - 根据 FFMPEG 中的音频信息进行缩放和移动

我最近想知道是否可以根据音频源在 FFMPEG 中缩放或移动事物。

我已经玩过,complex filters因为它们允许一些音频可视化,但并没有真正设法根据声音移动/缩放事物。在以下位置查看用于音频可视化的复杂过滤器的良好示例:https ://hhsprings.bitbucket.io/docs/programming/examples/ffmpeg/audio_visualization/index.html

我目前的情况是我有多个输入,其中一个应该对声音/甚至可能对特殊频率做出反应。

0 投票
0 回答
133 浏览

javascript - 切换到新音频源时音频上下文中断

我正在使用 chrome,并且我有一个 HTML 音频元素连接到这样的分析器:

完成后,我调用一个重置方法,该方法传入此处声明的四个变量,然后尝试休息/重新初始化,以便可以将它们用于从同一 api/source 传入的下一个文件:

但它似乎没有正确断开连接,因为我收到了这个错误:

这是HTML:

和 python Flask API:

0 投票
1 回答
32 浏览

classification - 检测两个音频文件是否由同一乐器生成

我正在尝试做的是在一小部分音频样本中检测是否由同一仪器生成。如果是这样,那些被认为是重复的并被过滤掉。

收听这个包含十个连接样本的文件。您可以听到前五个都是由同一乐器(电钢琴)生成的,因此其中四个被视为重复。

我可以使用什么算法或方法来解决这个问题?请注意,我不需要完整的仪器检测,因为我只对仪器是否相同感兴趣。另请注意,我的意思不是字面上的“相同的乐器”,而是“相同的声学风味只是不同的音高”。

0 投票
1 回答
501 浏览

signal-processing - 我们如何提高 Librosa 中的节奏检测精度?

我正在使用 Librosa 的本机 beat_track 函数,如下所示,

歌曲的原始速度是 at146 BPM而函数是近似的73.5 BPM。虽然我明白73.5*2 ~ 148 BPM。我们如何实现以下目标: 1. 知道何时放大/缩小估计 2. 通过某种形式的信号预处理来提高准确性。

我正在学习 DSP,因此可能不习惯所有的概念。任何指导表示赞赏。谢谢。

0 投票
0 回答
132 浏览

python - 如何使用 Python 识别和匹配 2 个或更多短音频文件的音频片段中的模式?

我正在开发一个原型,我试图在 2 个音频文件之间查找和匹配模式。举个简单的例子,假设我们有两个 5 秒的音频文件,我的录音如下: 1. “我爱狗”。2.“狗太棒了!”

在这里,我想分析和识别某些特征,以便我可以得出两个音频文件之间的共同词是“狗”这个词。请注意,内容并不重要。否则我可以将它转换为文本并匹配它。我想分析常见的特征模式。我对 mfcc、色度图等音频功能有基本的了解,但是在这种情况下使用什么以及如何使用?

0 投票
2 回答
269 浏览

python - 从 FFT 中找到显着频率

我已经使用音频频谱分析仪的代码位https://github.com/markjay4k/Audio-Spectrum-Analyzer-in-Python/blob/master/audio%20spectrum_pt2_spectrum_analyzer.ipynb设置了一个 python 音频流和 fft (我删除了所有的绘图代码),我想从我的 fft 中找到最突出的频率。

下面是 github 上未适配的音频频谱分析仪输出的截图,显示了我想从 fft(最突出的频率)得到的值。在这种情况下,该值约为 1555Hz。

期望值的图像

0 投票
2 回答
69 浏览

javascript - 位置 a-frame 声音分析

我想使用 Aframe 声音组件获得位置音频。但我也希望能够使用音频分析器节点分析所述音频。音频分析器需要指定源,但它似乎只适用于 <audio>元素而不是 Aframe 的内部声音组件。任何人都知道如何引用 component.sound 作为音频分析器的源?

0 投票
1 回答
107 浏览

three.js - Three.JS - AudioAnalyser() 在 Safari 中不能将音频源作为流类型使用

我正在使用Three.JS开发 3D 流式收音机,我将音乐作为 PeerConnection 发送给我的客户,并附加 aTHREE.AudioAnalyser()以显示根据频率移动的 3D 条。

声音在所有平台上都运行良好,但THREE.AudioAnalyser()流类型的输入源只能在 Chrome 上运行,Safari 根本无法运行:皱眉:

该函数console.log()loop()应该包含一个整数数组,在 Chrome 上都很好,Safari 日志[0,0,0,0,0,0,0,0]

什么可能导致此问题?它似乎在任何地方都可以工作,但不能在 Safari 上工作,而且它似乎只在源是流时才会失败。

0 投票
1 回答
77 浏览

feature-extraction - 寻找用于信息提取的音频分析库

嘿伙计们,我是音频分析的初学者,并试图找到一个库,它可以让我了解振幅、声音分类、应该检测背景噪声的内容。我已经尝试过 Paura/pyAudioAnalysis ( pAura: Python AUdio Recording and Analysis ),它分析了一些现场录音的信息。GitHub 中有没有好的音频分析库?