问题标签 [audio-analysis]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
367 浏览

react-native - react native 是否支持来自麦克风源的样本级音频回调?

我希望做一个基于 React Native 的应用程序,我可以在其中逐帧捕获音频并执行 DSP 分析。是否有任何基于 React Native 的库支持这种类型的功能?谢谢。

0 投票
2 回答
4580 浏览

python - 函数 numpy.fft.fftfreq 的含义

几天前,我遇到了有关FFT用法的答案

在答案中有一段这样的代码:

我在 numpy 文档(此处)中阅读了有关函数fftfreq的信息,发现它返回了一个包含以下内容的数组:

在我的例子中,d var 等于 1,n是偶数。

所以我的问题是:fftfreq的目的到底是什么?

我想知道它是否是一种三角形窗口函数。

0 投票
0 回答
187 浏览

spotify - 有没有办法从 Spotify API 获取曲目的梅尔频率倒谱系数?

我正在寻找 Spotify 轨道的MFCC(梅尔频率倒谱系数)。我的主要目标是识别曲目的类型,我现在正在研究的算法使用 MFCC 来提取曲目的特征。

我认为可能有两种方法可以做到这一点:

  1. Spotify 的 API 有一个名为https://api.spotify.com/v1/audio-analysis/ {id} 的端点。就是轨道的输出。也许有一种方法可以从此输出中获取 MFCC?
  2. 从 API 端点获取轨道的原始音频特征,然后使用(不同的)库在特征上应用 MFCC。

或者,我可以尝试其他任何方法吗?

谢谢 :)

编辑 :

  • 此处给出的轨道的音频分析 API 的输出包含一个名为“tmfccrack”的键。这与MFCC有关吗?
  • 我发现您可以通过 Spotify API 获取相应艺术家的流派来获取 Spotify 曲目的流派。这让我得到了我现在想要的东西,但我认为我应该保持这个问题的开放性,因为它要求曲目的 MFCC 而不仅仅是流派。
0 投票
1 回答
560 浏览

javascript - 没有 getUserMedia 的声音分析

我正在尝试分析浏览器的音频输出,但我不希望出现 getUserMedia 提示(它要求麦克风许可)。声源是 SpeechSynthesis 和 Mp3 文件。这是我的代码:

此代码工作正常,但它要求获得使用麦克风的权限!我对麦克风完全不感兴趣,我只需要测量音频输出。如果我检查所有可用设备:

我在浏览器中获得了可用设备的列表,包括“音频输出”。那么,有没有办法在媒体流中路由音频输出,然后可以在“createMediaStreamSource”函数中使用?我已经检查了音频 API 的所有文档,但找不到。感谢任何可以提供帮助的人!

0 投票
0 回答
32 浏览

audio - 如何从录音中提取比给定持续时间更长的稳定音高?

给定一段录音(单声道和单声道),用 Melodia 等算法提取旋律后,我想找到这个音高系列中频率几乎稳定的所有片段(与平均频率的最大偏差应该小于给定范围 R 持续至少 N 毫秒)。确定了这些片段后,我想获得每个此类片段的平均频率。

无需对这些音高执行任何进一步的计算(目标不是找到音阶或生成乐谱)。

是否已经为此目的预先构建了算法?如果没有,您将如何编写这样的算法(使用任何编程语言,使用任何库)?

非常感谢!

0 投票
1 回答
280 浏览

python - 如何从音频文件的分解频谱图计算实际频谱图?

我从这样的音频文件中分解了频谱图:

现在如何将分解的频谱图重构为实际的频谱图。

我想要的是这种类型的功能:

0 投票
1 回答
1185 浏览

python - 使用 python Librosa 分割音频文件

在使用 Librosa 拆分音频文件后,我想知道如何在 mp3 文件中获取结果片段查看音频图像

0 投票
1 回答
151 浏览

python - 减少 MFCC 输出

我正在尝试使用 python 库分析歌曲音频,输出是一个 numpy 数组,该数组的大小非常大,因为 MFCC 是针对音频的每一帧计算的。当我将此输出写入文件时,每首歌曲的输出约为 3-4MB。有没有办法将 N 帧信息减少为单行特征?

点击这里]([![MFCC 输出)

0 投票
2 回答
376 浏览

frequency-analysis - 声音频率分析

我用两个麦克风记录鸟儿的叫声。录音最长可达 3 小时,每天听完整个文件很费时间。我想要的是一个脚本,它获取我的原始文件并给我一堆简短的音频文件,每个文件都包含一个鸟叫声。使用我的麦克风,我可以录制 mp3 或 wav。但是脚本应该只接收频率高于 nHz 的哭声。此频率代表固定的背景声音,不应保存。我不知道哪种语言最适合我,我完全不知道该怎么做。

谢谢大家,托马斯

0 投票
2 回答
220 浏览

machine-learning - 音乐分类的最佳功能

我正在尝试开发一个应用程序,通过从已经被用户自己标记为最喜欢的音乐中训练神经网络来将音乐分类为可能喜欢或可能不喜欢的音乐。我以前从未做过音频分析,所以我对此几乎一无所知。为了使它成为一个准确的分类模型,我需要在我的音乐数据集中包含哪些特征。例如:- 分贝值、频率值、音频长度

谢谢你