-1

我正在使用 2 个工具在 Python 中读取 .wav 文件。首先 - 带模块soundfile

wav = sf.read(speech_file)
b = io.BytesIO(wav[0])

结果我得到了这样的字节数据。这是正确的:

....\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\ .....

然后我用模块阅读 .wav wave

wf = wave.open(speech_file, "rb")
data = wf.readframes(wf.getparams().nframes)

结果字节完全不正确:

....a\x00\xda\x00\xcb\x00\xba\x00\xb0\x00\xa3\x00\x8f\x00|\x00g\x00S\x00=\x00&\x00\x0b\x00\xf3\xff\xd4\xff\xb0\xff\x8d\xffe\xff\xff\x18\xff\xef\xfe\xc6\xfe\x99\xfed\xfe-\xfe\xf5\xfd\xc0\xfd\x92\xfdj....

为什么两个不同的工具没有给出相同的结果?如何从第一个字节对象制作第二个字节对象?事实上,我不能使用wave's 字节,因为它与原始音轨完全不同。

4

1 回答 1

0

内置模块wave读取DSD格式的.wav文件,音轨表示为0和1的序列。但是,soundfile读取PCM格式的.wav文件,这是信号幅度值的数组。

于 2021-09-22T23:29:07.693 回答