4

如何将音频np.array文件加载到 PyDub 库中?目前,我使用AudioSegment.from_wav(file_path),但如果我已经将 wav 文件加载为 numpy 数组,则不方便:

sample_rate, wav_sample = scipy.io.wavfile.read(file_path)

更新:我的 wav 文件都是 16 位单通道的。

4

1 回答 1

2

好的,用一粒盐来回答这个问题,因为我不知道pydub它是否正常工作,但你应该能够从提供它需要的所有参数的类初始化器中做到这一点:

sample_rate, wav_sample = scipy.io.wavfile.read(file_path) 
segment = AudioSegment(data=wav_sample.tobytes(),
                       sample_width=2,
                       frame_rate=sample_rate, channels=1)

假设是 16 位单通道样本,它似乎可以正常工作。

不同的样本宽度应该很容易从数组大小中推断出来(wav_sample.nbytes() / len(wav_sample)应该做的事情)。

请自己做一些测试,让我们知道!

编辑:多通道有点棘手,pydub据我所知,需要交织通道,而 scipy 将它们作为多列返回。但是使用 numpy 应该很容易以pydub想要的格式重塑数据,如下所示(未测试)?

np.vstack((wav_sample[:,0],wav_sample[:,1])).reshape((-1,), order='F') 
于 2018-01-02T08:31:31.320 回答