3

所以假设我想混合这两个音轨:

未混合

在 Audacity 中,我可以使用“混合和渲染”选项将它们混合在一起,我会得到这个:

大胆组合

但是,当我尝试编写自己的代码进行混合时,我得到了这个:

我的混音

这基本上就是我混合样本的方式:

private function mixSamples(sample1:UInt, sample2:UInt):UInt
{
    return (sample1 + sample2) & 0xFF;
}

(语法是 Haxe,但如果你不知道它应该很容易理解。)

这些是 8 位示例音频文件,我希望产品也是 8 位的,因此& 0xFF.

我确实明白,通过简单地添加样本,我应该期待剪辑。我的问题是,在 Audacity 中混合不会导致削波(至少不会像我的代码那样),并且通过查看第二个(较长)轨道的“尾部”,它似乎并没有降低幅度. 听起来也没有那么柔和。

所以基本上,我的问题是:Audacity 在做什么而我不是?我想混合音轨,让它们听起来就像它们在彼此之上播放一样,但我(显然)不想要这种可怕的剪辑。

编辑:

如果我在添加之前对值进行签名,然后按照 Radiodef 的建议取消对总和值的签名,这就是我得到的结果:

我的签名组合

如您所见,它比以前好得多,但与 Audacity 产生的结果相比,它仍然相当失真和嘈杂。所以我的问题仍然存在,Audacity 必须做一些不同的事情。

编辑2:

我将第一首曲目与我的代码和 Audacity 混合在一起,并比较了失真发生的点。这是 Audacity 的结果:

放大大胆

这是我的结果:

在此处输入图像描述

4

2 回答 2

5

我认为正在发生的事情是您将它们相加为无符号。典型的声波既有正面的也有负面的,这就是为什么它们以它们的方式相加(某些部分抵消)。如果您有一些 8 位样本为 -96,另一个样本为 96,并且您将它们相加,您将得到 0。如果您拥有的是无符号音频,您将得到样本 32 和 224 的总和 = 256(偏移和溢出) .

您需要做的是在求和之前签署它们。要对 8 位样本进行签名,请将它们转换为带符号的 int 类型并从所有样本中减去 128。我假设您拥有的是 WAV 文件,并且您需要在总和后再次取消签名。

Audacity 可能会进行浮点处理。我听说过一些关于浮点的真正可疑的说法,比如它具有“无限动态范围”和类似的垃圾,但它不像整数那样以相同的确定和明显的方式剪辑。浮点具有与整数相同的有限值范围,但最大值和最小值相距更远。(这是最简单的说法。)浮点可以允许音频中更大的幅度变化,但要注意的是整体信噪比低于整数。

由于奇怪的失真,我最好的猜测是它来自你正在使用的面具& 0xFF。如果你想实际剪辑而不是溢出,你需要自己做。

for (int i = 0; i < samplesLength; i++) {
    if (samples[i] > 127) {
        samples[i] = 127;
    } else if (samples[i] < -128) {
        samples[i] = -128;
    }
}

否则说你有两个样本是 125,求和得到 250(11111010)。然后你取消签名(加 128)并得到 378(101111010)。一个 & 会得到 1111010,即 122。其他数字可能会得到实际上为负数或接近 0 的结果。

如果您想在 8 位以外的位置进行剪辑,则位深度 n 的满量程将为例如 32767positive (2 ^ (n - 1)) - 1negative 2 ^ (n - 1)-32768 用于 16 位。

除了裁剪之外,您可以做的另一件事是搜索裁剪和规范化。就像是:

double[] normalize(double[] samples, int length, int destBits) {

    double fsNeg = -pow(2, destBits - 1);
    double fsPos = -fsNeg - 1;

    double peak = 0;
    double norm = 1;

    for (int i = 0; i < length; i++) {
        // find highest clip if there is one

        if (samples[i] < fsNeg || samples[i] > fsPos) {
            norm = abs(samples[i]);

            if (norm > peak) {
                norm = peak;
            }
        }
    }

    if (peak != 0) {

        // ratio to reduce to where there is not a clip
        norm = -fsNeg / peak;

        for (int i = 0; i < length; i++) {
            samples[i] *= norm;
        }
    }

    return samples;
}
于 2013-11-21T01:34:22.703 回答
1

它比你想象的要简单得多;尽管您的原始文件是 8 位的,但 Audacity 在内部将它们作为 32 位浮点处理。您可以在屏幕截图中看到这一点,在每个轨道左侧的信息面板中。这意味着将 2 个轨道加在一起意味着在每个点添加两个浮点样本,并且只会产生从 -2.0 到 +2.0 的样本值,然后将其限制在 -1 到 +1 的范围内。相比之下,将两个 8 位整数相加将产生另一个 8 位数字,其中值溢出并回绕。(无论您使用有符号值还是无符号值,这都适用。)

于 2013-11-22T03:11:47.180 回答