0

我正在实现音频数据的实时线性插值,它存储在交错的音频缓冲区中。音频文件可以是单声道或多声道。在单声道音频文件的情况下,我插值如下:

f_dex = offset + ((position / oldlength) * (newlength * b_channelcount));
i_dex = trunc(f_dex); // get truncated index
fraction = f_dex - i_dex; // calculate fraction value for interpolation
b_read = (b_sample[i_dex] + fraction * (b_sample[i_dex + b_channelcount] - b_sample[i_dex]));
outsample_left += b_read;
outsample_right += b_read;

这听起来很棒,我没有任何问题。但是,当我要读取多通道文件时,我必须更正计算的读取位置,以确保它在相应帧中的第一个样本上,例如:

f_dex = offset + ((position / oldlength) * (newlength * b_channelcount));
if ((long)trunc(f_dex) % 2) {
    f_dex -= 1.0;
}
i_dex = trunc(f_dex); // get truncated index
fraction = f_dex - i_dex; // calculate fraction value for interpolation
outsample_left += (b_sample[i_dex] + fraction * (b_sample[i_dex + b_channelcount] - b_sample[i_dex])) * w_read;
outsample_right += (b_sample[i_dex + 1] + fraction * (b_sample[(i_dex + 1) + b_channelcount] - b_sample[i_dex + 1])) * w_read;

现在这引入了一些数字噪声,我无法真正解释原因。是否有任何其他/更好的方法可以将实时线性插值应用于交错立体声文件?

4

1 回答 1

0

我对你的变量名有点困惑,position,似乎是输出,而oldlength和来自输入,?outsample_left/outsample_rightnewlengthoffsetb_sample

我认为您的问题包括b_channelcountf_dex. 试试吧

f_dex = offset + ((position / oldlength) * newlength);

您可以省略% 2检查和调整。这种调整没有达到你的预期。

附录 11/7:我遗漏了一些东西,你还需要调整你对 的使用i_dex,因为我在f_dex这里设置了每个通道的整个块数为 1。在你之前有的地方b_sample[i_dex],改为使用b_sample[i_dex*b_channelcount]; 这将使您进入该块的第一个样本(如果是立体声,则为左侧)。同样,b_sample[i_dex*b_channelcount + 1]如果有一个右通道,您可以将其用于b_sample[(i_dex+1)*b_channelcount]下一个块的第一个样本进行插值等。

于 2014-11-06T23:39:25.517 回答