0

我想编写一个程序,让我可以用电脑键盘播放样本声音,几乎没有延迟。

我的程序:

import numpy as np
import sounddevice as sd
import soundfile as sf
import msvcrt

sd.default.latency = 'low'

samplesarray = []

def load_samples(num):
    filename='sample'+str(num)+'.wav'
    data, fs = sf.read(filename, dtype='float32')
    sd.default.samplerate = fs
    samplesarray.append(data)
    return

numberofsamples=3

for i in range(numberofsamples):    
    load_samples(i+1)

def play_session():
    while 0==0:
        key = int(msvcrt.getch())
        sd.play(samplesarray[key-1])
    return

play_session()

程序文件夹包含许多名为 sample1.wav、sample2.wav 等的“one shot”短样本,例如底鼓或军鼓。在此示例中,为简单起见,仅加载了三个。我可以在终端中启动我当前的程序,并在我的按键上播放“映射”的样本,这正是我想要的。唯一的问题是延迟:虽然不是很大,但它绝对是显而易见的。

对于现场播放样本,理想情况下延迟应该实际上是不可感知的(几十毫秒的数量级)。

我怎么能做到这一点?

4

1 回答 1

0

除其他事项外,可能的最低延迟取决于您使用的主机 API。由于您正在导入msvcrt模块,我假设您使用的是 Windows,对吗?

您通常可以在其中选择多个主机 API。使用 WASAPI、WDM/KS 或 ASIO 通常可以达到最低延迟。

如果您使用 WASAPI,您可以尝试独占模式,这可能会降低延迟,但我不确定。

设置latency'low'(如您所做的那样)应该可以解决问题,但您也可以尝试使用不同的值blocksize。但请注意,太小的块大小会导致缓冲区下溢,这可能会导致听到咔嗒声。

最后,如果你真的想从你的设置中挤出最后一点延迟,你可能应该摆脱(每次调用都会sd.play()打开一个新的),而是在你自己的回调函数中实现你的播放逻辑。sd.OutputStream

于 2017-05-24T11:27:26.983 回答