0

通过“标准化”,我的意思是“增加/减少整体音量,使最大值达到最大动态余量”。

我是学校新闻组的一员,老师们会发送广告,但它们通常太大声或太小声。我想创建一个程序来规范化音频(无压缩或限制)。它通常必须与 .mov 和 .wmv 文件一起使用。谁能指导我一些好的教程、库等?

4

1 回答 1

2

从 AV 容器中解复用音频流并解压缩:您需要 ffmpeg 库的包装器。例如尝试 pyffmpeg、AVbin、pymedia。

归一化:使用每个样本整数的 Numpy 数组,找到最大值,然后将数组相乘以放大/衰减音量。考虑使用 ReplayGain。

重新压缩音频并与原始视频流重新复用到一个新容器中:与上述相同的库,但更可能导致困难,特别是对于专有容器和编解码器。(例如,我相信 ffmpeg 只能产生一个非常旧的 WMA 版本。)

与使用现成的应用程序相比,这并不简单,我不确定它是否一定值得。例如 ffmpeg 本身有一个命令行,你可以批处理脚本,例如 avidemux 有命令行和 GUI 界面。

另外,我怀疑您会发现简单的峰值归一化不会使您在使有效音量水平相似方面走得太远;通常你也需要使用一些动态范围压缩。

于 2012-05-05T20:11:44.680 回答