3

我想要做的是有一个子程序,它每 200 毫秒分析一次它给出的声音文件,并将特定频率范围的频率强度值(从 0 到 1 作为浮点数)吐出到我稍后的数组中节省。然后,该值将继续用作应该“频闪”到音频文件的图形的不透明度值。

问题是,我以前从未涉足音频分析,也不知道从哪里开始。我看过 pymedia 和 scipy/numpy 认为我可以使用 FFT 来实现这一点,但我不确定如何操纵这些数据以得到预期的结果。pymedia 的 SpectrAnalyzer 类的文档几乎不存在,并且网站上的示例实际上不适用于该库的最新版本 - 这并没有让我的生活更轻松。

我将如何开始这个项目?对于我什至应该使用哪些库,我完全不知所措。

4

1 回答 1

3

您首先需要了解采样是如何工作的,然后您应该使用 Scipy FFT 例程(它们非常快)来输出频率强度值,然后您可以使用 Matplotlib 绘制此类图形。有关使用 Python 分析声音文件的文章,请参见此处,此处是有关 Python 中的 FFT 和 Spectograms 的类似问题。

于 2010-06-13T23:16:53.597 回答