audio - 如何实时处理音频？

Question

我通过麦克风输入了一些音频。我用 Audacity 录制的，如下图所示。

音频波形

我想实时处理这个音频。我主要想这样做：

查看实时音频幅度与时间图。
根据事件执行一些操作，例如如果看到类似于某些预定义波形的波形，然后调用函数。
在图像的上半部分，您可以看到四个扰动。我希望每当看到这种干扰时，脚本应该调用一个函数，否则，当信号几乎是直线时，什么都不做，只是继续分析信号。

是否有任何 Python 模块或 C 库可以让我这样做？

score 4 · Accepted Answer

我建议先让自己了解 FFT，这将使您能够实时对音频处理进行大量分析和控制。

1# 前向 FFT 将为您提供时域内的幅度，从您的频域（音频数据本身）转换而来 2# 基于时间/频率内的幅度模式 - 您可以决定调用额外的线程或函数；例如 - 当您在某个频率仓或时隙上没有幅度时 - 做某事，否则跳过。

有很多开源 C 库可以对音频数据执行 FFT，例如http://aubio.org/或https://github.com/zaphire/Monocle-Engine/blob/master/Core/Audio/fft.cpp还有很多。但在继续之前，请务必让您了解 FFT 和声音分析。我个人没有使用过这些 C 库中的任何一个——而是在 iOS 音频分析方面做了很多工作，但工作原理应该是相似的

score 0 · Accepted Answer

赔率是PythonInMusic有你正在寻找的东西，但很难判断你的目标任务何时是“基于某些事情执行某些操作”

score 0 · Accepted Answer

如果我们在这里谈论语音识别，您可能会看一下蜻蜓，它被描述为

一个 Python 包，它提供高级对象模型并允许其用户轻松编写使用语音识别的脚本、宏和程序。

或pyspeech

Speech.py 是一个 Python 模块，它为 Windows 的语音识别和文本转语音功能提供了一个干净的界面。在需要听特定短语或一般语音或需要说话的程序中使用它非常容易。

无论如何，这两个 python 模块看起来像处理实时音频，可能会给你一些提示......

score 0 · Accepted Answer

对于第1点，您可以使用Pure Data。

第2点非常不具体，但您可以使用 PythonInMusic 试试运气（在 Mason Hemmel 的回答之后）

audio - 如何实时处理音频？

4 回答 4

Related

Reference