audio - 音频标准化/固定？

Question

我正在使用一些音频指纹技术来标记长录音中的歌曲。例如，在广播节目记录中。指纹机制工作正常，但我在规范化（或下采样）方面存在问题。

在这里，您可以看到两首相同的歌曲，但波形不同。我知道我应该做一些直流偏移固定并使用一些高增益和低增益滤波器。我已经通过 Sox 使用高通 1015 和低通 1015 完成了它们。我使用波增益来修复音量和 DC 偏移。但在这种情况下，波形变成如下所示：

但即使在这种情况下，我也无法获得相同的指纹。（我不期望 %100 相同，但至少 %50 会很好）

所以。你怎么看？我可以做些什么来修复具有相同指纹的记录？也许一些音频过滤会起作用，但我不知道该使用哪一个？你能帮助我吗？

顺便说一下，这里是指纹技术的解释。

score 2 · Accepted Answer

您的输入波形似乎被削波，因此再多的过滤也不会产生有意义的“指纹”。确保您收集了具有合理动态范围但不削波的有效输入样本。

1 回答 1