5

无论我只是嵌套它们(iff(fft(audio)))还是逐个窗口尝试(window音频,执行fft,执行ifft,然后反转窗口,用 eps 替换零,然后将样本合并回来(abs在管道中到处尝试))我只得到噪音。

我知道这与无限精度算术、无限多样本等ifft唯一相反fft(对吗?)我正在使用 64 位浮点和 44kHZ 采样率。但是,我希望至少能够听到原始音频。

我的错误是实际的还是理论上的?我可以给代码,如果它是一个错误。

4

1 回答 1

6

基于 JoeKington 的评论,我已经下载了这个文件,并尝试了以下

>>> import scipy.io.wavfile
>>> rate, data = scipy.io.wavfile.read('wahoo.wav')
>>> data
array([134, 134, 134, ..., 124, 124, 124], dtype=uint8)
>>> data_bis = np.fft.ifft(np.fft.fft(data))
>>> data_bis
array([ 134. +6.68519934e-14j,  134. -4.57982480e-14j,
        134. -1.78967708e-14j, ...,  124. -2.09835513e-14j,
        124. -1.61750469e-14j,  124. -2.14867343e-14j])
>>> data_bis = data_bis.astype('uint8')
C:\Users\Jaime y Eva\Desktop\stack_exchange.py:1: ComplexWarning: Casting complex values to real discards the imaginary part
  # -*- coding: utf-8 -*-
>>> data_bis
array([134, 133, 133, ..., 123, 123, 123], dtype=uint8)
>>> scipy.io.wavfile.write('wahoo_bis.wav', rate, data_bis)

结果文件的播放方式与原始文件完全相同。

因此,将返回的复数值转换为实数只是问题的一半(并且您可能希望使用np.abs而不是data.real,正如上面的代码隐式所做的那样),然后您还需要将浮点数重新转换uint为适当位的 s -深度。

于 2013-01-29T03:07:09.040 回答