问题标签 [audio-analysis]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

87 问题

0 投票

0 回答

214 浏览

c# - 如何在c#中获取音频文件的频率数组

当我在 C# 中输入音频文件时，我想获得一个频率数组。我从来没有做过任何与这个话题相关的事情，所以我是个菜鸟。如果问题太宽泛，请帮我缩小范围。

c#visual-studio audio audio-analysis

2019-05-07T07:15:04.967

0 投票

0 回答

118 浏览

python - 如何计算wav文件的瞬时频率

我有一个包含人声录音的 wav 文件。我想计算所说单词的平均频率。通常男性声音高达200hz，女性声音略高。例如。我想要像 170 赫兹这样的答案，但我不知道该怎么做。请帮我。

python wav frequency-analysis audio-analysis

2019-07-04T14:28:26.130

0 投票

1 回答

1852 浏览

python - 使用 Librosa 检测节拍能量，找到每个小节的第一个节拍

我需要使用 Librosa 找到峰值的能量，以便检测每个小节的第一个节拍。

我正在使用 Librosa 来检测点击轨道中的音频节拍。这运行良好，但我现在希望检测每个小节的第一个节拍。我相信最好的方法是检测每个节拍的能量或音高。

目前我正在将所有节拍记录到一个数组中。如何检测每个小节的第一个节拍？

python librosa audio-analysis

2019-08-06T21:48:36.640

0 投票

0 回答

242 浏览

python - 如何分析扬声器音频输出以进行频率分析？蟒蛇 3.6

Python 3.6 Ubuntu 18.04

使用 pyaudio 模块，我已经成功录制了从扬声器发出的音频，并且为了测试，我已经能够正确地将其保存到 WAV 文件中。这是一个更大的多线程应用程序的一部分，所以我很高兴看到协调按计划进行。不过，现在我想对数据进行一些音频分析，以收集音频中存在的主要频率。所以，我有几个问题，一个更笼统，因为我很好奇，另一个更具体到我的问题：

1.) 这是我用来捕获音频帧的代码片段：

我的第一个问题是：audio_frame变量中代表了什么样的数据？我为每个读取操作返回一个 4096 字节的列表（即使AUDIO_FRAME_SIZE_BYTES设置为 1024），这实际上描述了什么？难道都是纯粹的音频数据，通道数和格式等东西需要以后再提供来重新解释？或者4096字节中是否包含类似的信息？

2.) 对此数据执行频率分析的最佳方法是什么？我看到很多关于对 WAV 文件内容执行 FFT 的最佳方法的信息，但我想实时执行此操作，或者接近它。我看不到同时打开一个 WAV 文件进行读写的方法，所以我基本上无法通过那里传递它。我可以对中的原始数据执行此分析audio_frame吗？我想这就是为什么我问我的第一个问题，看看我是否能够遵循这个 SO 答案中的一般逻辑，而不必实际写入 WAV 文件。

先感谢您！

python audio audio-analysis

2019-09-18T05:38:52.890

0 投票

2 回答

453 浏览

javascript - 我可以使用 webAudio API 从 Chrome 访问本地音频输出流吗？

我正在尝试对在我的计算机上运行的可视化器进行一些音频分析。

是否可以直接从浏览器访问输出音频数据流？

当前使用three.js 和meyda 库运行JavaScript。

我已经弄清楚如何使用 webAudio API 来分析来自麦克风的输入，但似乎无法访问我计算机上的音频输出。

我尝试使用将源连接到目标

但这似乎无济于事。

这是我们当前的监听器配置：

javascript audio web-audio-api audio-analysis

2019-09-19T17:28:35.373

0 投票

1 回答

84 浏览

c# - Azure 媒体服务 V3 音频分析器脚本 10 分钟限制

我有一个使用Azure 媒体服务广播视频流的项目，当广播结束时，它会将生成的资产提供给作业以从中提取见解。

问题在于它完美地生成了所有洞察数据，但转录（语音转文本）仅能运行 10 分钟。

我可以看到视频在 30 分钟时分析的缩略图：

但成绩单总是在 10 分钟标记处停止生成数据

广播在我嵌入网站的 AMS 播放器中正确显示，如果我下载广播文件并使用试用帐户将其上传到videoindexer.ai，它会为整个视频生成脚本 OK。

视频索引器选项在那里，但我想避免将另一个服务和 API 链接到应用程序中，因此欢迎任何克服 10 分钟限制的帮助。

c#azure azure-media-services audio-analysis

2019-09-26T08:16:09.787

0 投票

0 回答

17 浏览

rest - 视频中的音频识别

我需要使用一小部分音频从视频中知道确切的时间范围位置。我更喜欢使用外部 api，使用 google、amazon 或 Microsoft 语音/音频解决方案。任何人都知道我可以使用什么？谢谢。

rest audio-recording audio-analysis

2019-10-15T15:11:18.357

0 投票

2 回答

47 浏览

python-3.x - 文件夹的形成冗余

我有以下结构。我想遍历子文件夹（机器、枪击）并处理 .wav 文件并在每个类别中构建 mfccresult 文件夹和其中的 .csv 文件。我有以下代码，并且 MFCC 文件夹在已经形成的 MFCC 文件夹中不断形成。

python-3.x google-colaboratory audio-analysis

2019-11-08T06:34:34.870

0 投票

0 回答

179 浏览

python-3.x - 元组索引超出范围 - 训练音频模型

我正在尝试分析音频文件并根据提取的特征训练系统，但在拟合模型时出现错误，提示“元组索引超出范围”。我在打印语句旁边的注释中提供了我正在使用的所有数组的形状。你能帮我理解在定义模型时如何定义尺寸吗？

如果需要更多详细信息，请告诉我。

- - - - - - - - - -错误 - - - - - - - - - - - - - - - ----------------------

python-3.x tensorflow machine-learning keras audio-analysis

2019-11-30T19:22:58.003

0 投票

0 回答

57 浏览

javascript - 如何在js中计算信号的包络

我有一个系统，可以将吉他和弦的声音记录到 Arduino。每个和弦的结果是一个 0 到 1024 之间的数字数组。所以一个数组代表一个音频频谱。我将每个数组发送到 nodeJS 服务器。我想计算每个音频频谱的包络，但我不知道如何实现。如果可能的话，我更喜欢使用 javascript 解决方案，因为我的服务器使用 javascript。

我添加了一张近似图。我拥有的是蓝色数据；我想要的是一个包含红色数据的数组。

javascript envelope audio-analysis

2019-12-10T14:49:18.140

1 2 3 4 5 6 7 8 9 10

问题标签 [audio-analysis]

Reference