3

我正在尝试在 AS3 中将 8000hz、16 位 wav 文件上采样到 11025hz。在这一点上,我并不关心应用我知道我最终需要的低通滤波器。

我一直在参考这个 wiki 页面

这是我到目前为止所做的:

  1. 计算出最小公倍数为 3528000
  2. 计算 L 为 441
  3. 计算 M 为 320
  4. 在样本之间添加了 440 个零
  5. 每 320 个样本写入一个新的字节数组

但是,当我去播放新的 wav 时,它是无法区分的噪音。这是我的代码:

const sourceRate:uint = 8000;
const targetRate:uint = 11025;
var lcm:uint = lcm(targetRate, sourceRate); // = 3528000
var l:uint = lcm / sourceRate; // = 441
var m:uint = lcm / targetRate; // = 320

// upsample by factor of l
var upsampleData:ByteArray = new ByteArray();
upsampleData.endian = Endian.LITTLE_ENDIAN;

// originalWavData is a ByteArray of the source wav data
// fill is a ByteArray that contains 440 zeroes, written using writeShort(0x0)

while(originalWavData.bytesAvailable > 1) {
    upsampleData.writeBytes(fill);
    upsampleData.writeShort(originalWavData.readShort());
}

// downsample by factor of m
var downsampleData:ByteArray = new ByteArray();
downsampleData.endian = Endian.LITTLE_ENDIAN;

upsampleData.position = 0;

for(var k:uint=0; k<upsampleData.length; k++) {
    upsampleData.position = k * m;
    if(upsampleData.bytesAvailable < 2) break;
    downsampleData.writeShort(upsampleData.readShort());
}

谁能告诉我我在代码中做错了什么?这是我的第一个问题帖子,所以如果我忘记了什么,或者需要提供更多信息,请告诉我。

谢谢!

更新:

我简化了 Aric 的答案,现在使用以下代码成功地进行了上采样:

/**
 * Generates a ByteArray containing numSamples of
 * data using linear interpolation between points
 * y0 and y1.
 */
function interpolate(y0:int, y1:int, numSamples:uint):ByteArray {
    var b:ByteArray = new ByteArray();
    b.endian = Endian.LITTLE_ENDIAN;
    var m:Number = Math.round((y1-y0)/numSamples);
    for(var i:uint=0; i<numSamples; i++) {
        var n:int = m * i + y0;
        b.writeShort(n);
    }
    b.position = 0;
    return 0;
}

// upsample by factor of l
var n1:int = 0;
while(originalWavData.bytesAvailable > 1) {
    var sample:int = originalWavData.readShort();
    upsampleData.writeBytes(interpolate(n1, sample, (l-1)));
    n1 = sample;
}

// downsample by factor of m
while(upsampleData.bytesAvailable > 1) {
    downsampleData.writeShort(upsampleData.readShort());
    upsampleData.position += ((m-1)*2);
}

关于此解决方案需要注意的几点:我正在对音频验证码进行上采样,因此音质并不是非常重要。此外,第一个样本只是静音,所以我不需要计算第一个样本左侧的值。这就是为什么 n1 最初等于 0 的原因。此外,我没有在我的下采样中对生成的样本进行平均,而是抓住了每个 Mth 样本,这听起来对我的目的来说很好。

我确信有 1000 种更好的方法可以做到这一点,但对于我所需要的,它是有效的。再次感谢 Aric 的回答。

4

1 回答 1

5

您是否有特定原因要进行上采样?上采样不会为您提供更好的音频,就像将手机对话录制到 CD 上一样会给您“CD 质量”的音频。

如果你真的想上采样,那么正如 Lasse 所说,不要只插入零。正如维基百科指出的那样,您需要插值采样到 3528000 Hz,然后再下采样回 11025 Hz。

对于上采样,一种方法是在每个点之间使用线算法。假设 8 kHz 录音中的前三个样本是:[15,25,33]。

要将这三个样本上采样到 3528000 Hz,您需要输出 (441 * 3 = 1323) 个样本。第 220 个样本应该是 15,第 661 个样本应该是 25,第 1102 个样本应该是 33。在这些点之间画一条直线,你会得到一个不错的上采样。

完成此操作后,您需要将 1323 个样本采样到大约 4 个样本。第一个应该是样本160-480的平均值,第二个应该是481-800的平均值,第三个应该是801-1160的平均值,第四个应该是1161-1480的平均值。当然,您缺少样本 1324-1480,您可以在原始数据中使用样本 #4 生成这些样本。

这至少应该让你接近。但在你这样做之前,问问自己是否真的需要上采样。除非您使用一些只采用某些格式的奇怪软件,否则最好只提供您拥有的数据。

于 2009-12-16T22:46:36.417 回答