我会忘记 mp3 ......你的压缩技术取代了 mp3 ......相反,我会在这里专注于 PCM 格式的原始音频
他们的过程
PCM -> conversion to mp3 -> mp3 file -> decoding to PCM -> PCM
你的过程
PCM -> your compression trick -> SpentDeath file -> decoding to PCM -> PCM
只需使用相同的原始音频 PCM 作为上述两个流程的输入...一个比较是 mp3 的文件大小与您的压缩文件相比...第二个比较是输出最终 PCM 的质量
我听到您所说的关于它不是 FFT 但请记住,如果它是 FFT,您具有更大频率粒度(每个频率与其幅度之间的差异更小)的程度,所需的音频样本数量就更多......这意味着频率空间中更高的频率测量精度需要时域中更长的音频样本窗口......这对于非周期性信号来说很好(当音频只是一个恒定的音调而不是歌曲时)......然而,对于像一首非周期性的歌曲那样不断变化的音频,没有有意义的音频样本宽窗口这样的东西,因为当你扩大采样窗口时,你会从不断变化的音频信号中包含更多不同的曲线,因此产生的频率幅度将来自整个采样窗口中遇到的所有频率的平均值,因此一旦 FFT 使用傅里叶逆变换将您的音频信号返回到 PCM,您付出的代价就是时域精度的损失