0

我只是在使用 python 在树莓派上玩声音输入和输出。我的计划是读取麦克风的输入,操纵它并播放操纵的音频。目前我试图阅读和播放音频。读取似乎有效,因为我在最后一步将读取的数据写入了波形文件,并且波形文件看起来很好。但播放只是噪音。播放波形文件也很好,所以耳机很好。我想我的设置或输出格式可能有问题。编码:

import alsaaudio as audio
import time
import audioop


#Input & Output Settings
periodsize = 1024
audioformat = audio.PCM_FORMAT_FLOAT_LE
channels = 16
framerate=8000

#Input Device
inp = audio.PCM(audio.PCM_CAPTURE,audio.PCM_NONBLOCK,device='hw:1,0')
inp.setchannels(channels)
inp.setrate(framerate)
inp.setformat(audioformat)
inp.setperiodsize(periodsize)

#Output Device
out = audio.PCM(audio.PCM_PLAYBACK,device='hw:0,0')
out.setchannels(channels)
out.setrate(framerate)
out.setformat(audioformat)
out.setperiodsize(periodsize)


#Reading the Input
allData = bytearray()
count = 0
while True:
    #reading the input into one long bytearray
    l,data = inp.read()
    for b in data:
        allData.append(b)

    #Just an ending condition
    count += 1
    if count == 4000:
        break

    time.sleep(.001)


#splitting the bytearray into period sized chunks
list1 = [allData[i:i+periodsize] for i in range(0, len(allData), periodsize)]

#Writing the output
for arr in list1:
    # I tested writing the arr's to a wave file at this point
    # and the wave file was fine
    out.write(arr)

编辑:也许我应该提到,我正在使用 python 3

4

2 回答 2

0

我刚刚找到了答案。audioformat = audio.PCM_FORMAT_FLOAT_LE这种格式不是我的耳机使用的格式(只是复制并粘贴它而不加考虑)。speaker-test我通过在控制台中运行了解了我的麦克风格式(和其他信息) 。

由于我的扬声器格式是S16_LE,因此代码可以正常使用audioformat = audio.PCM_FORMAT_S16_LE

于 2017-05-21T17:29:17.973 回答
0

考虑至少对链的接收器部分使用plughw(支持重采样/转换的alsa子系统):

#Output Device out = audio.PCM(audio.PCM_PLAYBACK,device='plughw:0,0')

这应该有助于协商采样率和数据格式。

periodsize 最好根据采样率的 1/倍进行估计,例如:

periodsize = framerate / 8(8 = 8000 KHz 采样率的倍数)

并且 sleeptime 最好估计为玩 periodsize 所需时间的一半:

sleeptime = 1.0 / 16(1.0 - 是一秒,对于 8000 KHz 采样率,16 = 2 * 倍)

于 2018-04-08T09:26:54.743 回答