如何将音频np.array
文件加载到 PyDub 库中?目前,我使用AudioSegment.from_wav(file_path)
,但如果我已经将 wav 文件加载为 numpy 数组,则不方便:
sample_rate, wav_sample = scipy.io.wavfile.read(file_path)
更新:我的 wav 文件都是 16 位单通道的。
好的,用一粒盐来回答这个问题,因为我不知道pydub
它是否正常工作,但你应该能够从提供它需要的所有参数的类初始化器中做到这一点:
sample_rate, wav_sample = scipy.io.wavfile.read(file_path)
segment = AudioSegment(data=wav_sample.tobytes(),
sample_width=2,
frame_rate=sample_rate, channels=1)
假设是 16 位单通道样本,它似乎可以正常工作。
不同的样本宽度应该很容易从数组大小中推断出来(wav_sample.nbytes() / len(wav_sample)
应该做的事情)。
请自己做一些测试,让我们知道!
编辑:多通道有点棘手,pydub
据我所知,需要交织通道,而 scipy 将它们作为多列返回。但是使用 numpy 应该很容易以pydub
想要的格式重塑数据,如下所示(未测试)?
np.vstack((wav_sample[:,0],wav_sample[:,1])).reshape((-1,), order='F')