2

我正在使用 scipy.fftpack 和 scipy.io 包在 Python 中处理一些音频文件。这意味着我有要导入的波形文件,使用傅里叶变换处理它们,然后输出到新的波形文件。但是,我遇到了一些问题,在运行这些转换后,波形文件将无法播放,并且大约是原始文件大小的 4 倍。

目前我只是导入歌曲,从导入中获取速率,数据片段,执行 ifft(fft(data)) 然后输出。我尝试采用这些浮点值并将其转换为整数并计算初始导入数据与 ifft(fft(data)) 之间的差异,发现它正好为零。

所以以下是我的问题:

  1. 有谁知道为什么我在进行傅立叶变换后尝试播放的波形文件无法播放?

  2. 波形文件是否有任何限制可能会导致一般问题。还是数据必须是整数?

已经很晚了,我觉得我的帖子可能是分散的,所以如果您需要更多信息,请询问,我会尽力提供更好的描述。

4

1 回答 1

4

您需要在处理后将数据转换为适当位深度的整数类型。以这个文件为例:

>>> import scipy.io.wavfile
>>> rate, data = scipy.io.wavfile.read('Happy Tree Friends.wav')
>>> rate
8000
>>> data
array([ 5, -5,  5, ...,  0, -1,  0], dtype=int16)
>>> data_bis = np.fft.ifft(np.fft.fft(data))
>>> data_bis
array([  5.00000000e+00 -1.55406753e-11j,
        -5.00000000e+00 +1.95349676e-11j,
         5.00000000e+00 +1.41131140e-11j, ...,
         8.06674092e-12 -7.58643463e-13j,
        -1.00000000e+00 -2.21611283e-12j,  -2.04999489e-11 +4.55890751e-12j])
>>> data_bis.dtype
dtype('complex128')

尽管 中的值data非常接近 中的值data_bis,但它们是非常不同的野兽,如下所示:

>>> scipy.io.wavfile.write('test.wav', rate, data_bis)
>>> scipy.io.wavfile.read('test.wav')
TypeError: data type not understood

但是,如果您只是将处理后的结果转换回原始结果dtype,一切都会再次正常运行:

>>> scipy.io.wavfile.write('test.wav', rate, data_bis.astype(data.dtype))
__main__:1: ComplexWarning: Casting complex values to real discards the imaginary part
>>> scipy.io.wavfile.read('test.wav')
(8000, array([ 4, -5,  4, ...,  0, -1,  0], dtype=int16))
于 2013-03-24T08:11:35.167 回答