问题标签 [amplitude]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
4131 浏览

python - 在声音文件中获取给定时间的幅度?

我正在做一个项目,我需要知道来自计算机麦克风的声音幅度。

我目前正在将 Python 与Snack Sound Toolkit一起使用,我可以录制来自麦克风的音频,但我需要知道该音频的响度。我可以将录音保存到一个文件中,并使用另一个工具包从音频文件中读取给定时间点的幅度,或者尝试在音频进入时获取幅度(这可能更容易出错)。

是否有任何库或示例代码可以帮助我解决这个问题?我一直在寻找,到目前为止,Snack Sound Toolkit 似乎是我最大的希望,但似乎没有办法直接访问振幅。

0 投票
1 回答
4412 浏览

flash - 如何使用 Flash Player 9 在 Flash AS3 中计算频率和幅度

如何使用 FP9 计算 As3 中的频率和幅度。我得到了所有原始字节使用

现在我可以从中获取频率和幅度数据吗?

0 投票
2 回答
1234 浏览

simulink - Simulink:可以形成幅度在 -1 和 +1 之间的脉冲发生器

好的 - 我已经启动并运行了 Simulink,我正在使用具有非常简单的传递函数和示波器的脉冲发生器。但是,我想使用从 -1 到 +1 而不是从 0 到 +1 的脉冲。有没有办法改变脉冲发生器模块,使幅度在 -1 和 +1 之间?

谢谢。

0 投票
2 回答
1490 浏览

java - 绘图幅度

我想知道是否有人可以向我指出一个好的教程或向我展示如何从字节数组中绘制幅度。我使用的音频格式是:U LAW 8000.0 Hz,8 位,单声道,1 字节/帧。

0 投票
3 回答
3967 浏览

android - Android中的语音活动检测

我正在编写一个应用程序,其行为类似于现有的语音识别,但会将声音数据发送到专有的 Web 服务以执行语音识别部分。我正在使用标准的 MediaRecord(它是 AMR-NB 编码的),它似乎非常适合语音识别。唯一提供的数据是通过getMaxAmplitude()方法提供的 Amplitude。

我正在尝试检测此人何时开始说话,以便当此人停止说话约 2 秒钟时,我可以继续将声音数据发送到 Web 服务。现在我正在使用一个幅度阈值,如果它超过一个值(即 1500),那么我假设这个人正在说话。我担心的是幅度级别可能因设备(即 Nexus One v Droid)而异,因此我正在寻找一种更标准的方法,可以从幅度值中得出。

PS我查看了graphing-amplitude,但它没有提供仅使用幅度的方法。

0 投票
1 回答
3650 浏览

linux - 如何从音频文件中获取振幅列表?

如何使用 linux 命令行工具从音频文件中获取幅度列表?

0 投票
2 回答
10926 浏览

python - 从 *.wav 文件中提取振幅列表以在 Python 中使用

我遇到了一些编程和转换问题。我正在设计一个人工智能来识别乐器演奏的音符,并且需要从波形文件中提取原始声音数据。我的目标是在文件中的时间块上执行 FFT 操作以供 AI 使用。为此,我需要音频文件的幅度列表,但我似乎找不到可行的转换技术。这些文件以 MP3 开头,然后我将它们转换为 wav 文件,但我总是得到一个压缩文件,当我尝试阅读它时会吐出乱码。有谁知道我如何将 wav 文件转换为与 Python 的 wave 模块兼容的文件,甚至可以将数据直接转换为幅度列表的文件?

0 投票
1 回答
1115 浏览

fft - 如何对大量数据使用 FFT 来绘制幅频响应?

我是一名程序员,不是一个好的数学家,所以 FFT 对我来说就像一个黑匣子,我想把一些数据扔到一些 FFT 库中并得到一个可绘制的 AFR(幅频响应)数据,就像 Rightmark 音频这样的软件做:

http://www.ixbt.com/proaudio/behringer/3031a/fr-hf.png

现在我有一个系统可以播放对数扫频正弦波(带有短淡入/淡出以避免尖锐的边缘)并记录音频系统的响应。

据我了解,我需要将输入用零填充到 2^n,使用音频样本作为复数的实部,设置虚数 = 0,然后我将从 FFT 中返回频率箱阵列一半输入数据的长度。

但是,如果我不需要像几秒钟的音频缓冲区给我的那样大的频率分辨率,那么正确的方法是制作,比如说,1024 大小的 FFT 窗口,输入音频块并取回 512 个频率点,其中考虑到我传入的所有数据?或者也许这是不可能的,我需要一次输入整个扫描正弦来取回我需要的所有 AFR 数据?

还需要平滑吗?我已经看到 FFT 的原始输出可能非常嘈杂。什么是尽早避免噪声的正确方法,所以我只看到来自 AFR 本身而不是来自 FFT 计算的噪声(就像我给出的链接中的图像 - 它看起来很平滑)?

我是一名 C++/C# 程序员。我将不胜感激任何展示如何处理扫频正弦端取回 AFR 数据的示例。目前我只找到实时处理小块数据的示例,这不是我需要的。

0 投票
3 回答
2500 浏览

c++ - 放大 WaveForm 音频的正确公式是什么?

我想知道 C++ 中放大 WaveForm 音频的正确公式是什么。

假设有一个 16 位波形数据如下: 0x0000 0x2000, 0x3000, 0x2000, 0x0000, (负部分), ...

由于声学原因,只是将数字加倍不会产生两倍大的音频,如下所示:0x0000 0x4000, 0x6000, 0x4000, 0x0000, (加倍负部分), ...

如果有人对音频修改很了解,请告诉我。

0 投票
2 回答
2316 浏览

fft - 吻 FFT bin 幅度

我花了很多时间研究 FFT。我对使用 KISSFFT 特别感兴趣,因为它是一个非常便携的 C 实现。

我仍然不清楚如何将 i[x] 和 r[x] 转换为频率仓的幅度。所以创建了一个有符号的 int 16 版本的 sin。我有 512 个正弦波样本。我希望看到一个带有数据的 Bin,而其余的则为零。不是这样...

这是我的代码...

}

我得到的结果看起来像这样......