我正在尝试并行化称为 Chromaprint 的声学指纹库的 FFT 变换。它的工作原理是“将原始音频分割成许多重叠的帧并对其应用傅里叶变换”。Chromaprint 使用 4096 的帧大小,有 2/3 的重叠。例如,第一帧由元素 [0...4095] 组成,然后第二帧类似于 [1366.. 5462]。
使用 cufftPlanMany,我知道您可以指定大小为 4096 的批次,这将执行 [0...4095]、[4096...8192] 等批次。是否有某种方法可以使批量转换重叠,或者应该我考虑另一种不使用批处理执行的方法?