2

您好我想将通过麦克风录制的音频流转换为整数数组(或浮点数或其他)以供以后分析(fft 等)。然而,我目前的方法让我觉得效率有点低,而且我认为我看到了零星的内存分配延迟。

我正在使用 alsaaudio,因为 ossaudiodev 不再适用于大多数 Linux 发行版,但这并不重要。我从设备中得到的音频流是一串 2048 个字符,对应于 1024 个 16 位音频帧。我认为“数组”是将字符串转换为整数数组的最佳方法,但是在每个循环结束时,我必须为下一轮数据清除数组,del如果查看时间需要循环内部运行(不包括读取)我看到每第 4 个或第 5 个(它是零星的)循环将花费更长的时间,所以我的问题是在内存分配方面我当前的策略有效吗?

音频设备设置如下:

import array
import alsaaudio as alsa
audio_data = array.array("h")
ain = alsa.PCM(alsa.PCM_CAPTURE,alsa.PCM_NORMAL,card='default')
ain.setchannels(1)
ain.setrate(rate)
ain.setformat(alsa.PCM_FORMAT_S16_LE)
ain.setperiodsize(1024)

然后在一个循环中我这样做

Nsamples,astream = ain.read()
audio_data.fromstring(astream)
## some analysis is done (FFT, plot whatever)
# i.e. 
Freq = np.abs(sy.fft(audio_data))
# clear the audio data array for next segment
del audio_data[:]
4

1 回答 1

1

你试过 numpy.fromstring 吗?

于 2012-06-14T05:55:25.810 回答