7

我通过麦克风输入了一些音频。我用 Audacity 录制的,如下图所示。

音频波形

我想实时处理这个音频。我主要想这样做:

  1. 查看实时音频幅度与时间图。

  2. 根据事件执行一些操作,例如如果看到类似于某些预定义波形的波形,然后调用函数。
    在图像的上半部分,您可以看到四个扰动。我希望每当看到这种干扰时,脚本应该调用一个函数,否则,当信号几乎是直线时,什么都不做,只是继续分析信号。

是否有任何 Python 模块或 C 库可以让我这样做?

4

4 回答 4

4

我建议先让自己了解 FFT,这将使您能够实时对音频处理进行大量分析和控制。

1# 前向 FFT 将为您提供时域内的幅度,从您的频域(音频数据本身)转换而来 2# 基于时间/频率内的幅度模式 - 您可以决定调用额外的线程或函数;例如 - 当您在某个频率仓或时隙上没有幅度时 - 做某事,否则跳过。

有很多开源 C 库可以对音频数据执行 FFT,例如http://aubio.org/https://github.com/zaphire/Monocle-Engine/blob/master/Core/Audio/fft.cpp还有很多。但在继续之前,请务必让您了解 FFT 和声音分析。我个人没有使用过这些 C 库中的任何一个——而是在 iOS 音频分析方面做了很多工作,但工作原理应该是相似的

于 2013-07-05T21:18:51.960 回答
0

赔率是PythonInMusic有你正在寻找的东西,但很难判断你的目标任务何时是“基于某些事情执行某些操作”

于 2013-07-03T17:56:15.140 回答
0

如果我们在这里谈论语音识别,您可能会看一下蜻蜓,它被描述为

一个 Python 包,它提供高级对象模型并允许其用户轻松编写使用语音识别的脚本、宏和程序。

pyspeech

Speech.py​​ 是一个 Python 模块,它为 Windows 的语音识别和文本转语音功能提供了一个干净的界面。在需要听特定短语或一般语音或需要说话的程序中使用它非常容易。

无论如何,这两个 python 模块看起来像处理实时音频,可能会给你一些提示......

于 2013-07-05T15:42:14.043 回答
0

对于第1点,您可以使用Pure Data

第2点非常不具体,但您可以使用 PythonInMusic 试试运气(在 Mason Hemmel 的回答之后)

于 2013-07-05T20:52:30.287 回答