0

作为一名收藏家,我拥有从播客服务下载的数千个音频文件。所有提要都以 15 秒的相同介绍开始。这对我来说很烦人,所以我尝试将它们全部裁剪。

但它们都不是规则的。语音演示完全相同,但其中一些...

  • ...从 00:00 或 00:05 或我们不知道的任何秒开始
  • ...没有关于启动的介绍

我无法确定应该裁剪哪几秒。

问题:我们如何根据特定的音频剪辑裁剪所有音频文件?

用其他说法“检测相同的部分并删除它”?

4

1 回答 1

0

据我了解,您已经有办法在特定点裁剪文件。所以问题归结为找出每个剪辑中介绍的结束位置。这是我的做法:

  • 首先,手动将介绍音频隔离在单独的文件/缓冲区中。
  • 对于每个剪辑,您需要确定在剪辑中出现介绍音频的位置。通过计算介绍音频和主剪辑之间的互相关来做到这一点。正确的偏移量将是具有最高相关系数的偏移量。(您也可以在均值差中寻找最小值,这是等效的。)
  • 一旦你知道介绍音频的位置,你就可以计算你的裁剪位置。

有一些明显的优化:

  • 仅在每个剪辑的前(例如)30 秒内搜索介绍音频。
  • 不要搜索整个介绍音频,只搜索最后 1/2 秒。
  • 如果您不能 100% 确定音频是否存在,您可能需要设置接受阈值。
于 2014-05-20T10:27:53.330 回答