0

您能否解释或指出正确的方法来思考如何在 wav 文件上实现两种音效。

所以我读取 wav 文件并将其转换为 int 值(在numpy数组中)

array([59383, 58290, 60629, ..., 52606, 51982, 56274], dtype=uint16)

首先,我不确定我是否清楚数组中的这些值真正代表什么?每个值都是unsigned int16模拟输出设备将在某个时刻产生的 65535 () 幅度级别之一,这对吗?

理论上合唱效果可以通过以下步骤来实现:

  1. 复制原始数组
  2. 削弱这个复制的数组(乘以一些value < 1
  3. 并将这个复制的数组添加到原始数组

在实践中,我不知道如何正确添加它们。我是否应该简单地一个一个地添加值,对两个数组进行卷积或交错原始数组并且它是修改后的副本。合唱效果也应该有任意的 时间延迟 ,我不知道我怎么能做到这一点。

我怎样才能实现我要添加的数据的随机性?

4

1 回答 1

1

你基本上有正确的想法。这里有几点:

1)波形文件是线性信号与时间,所以你的理解是正确的。(许多音频事物都是对数的,因此认为它可能是非线性的并非不合理——例如,LP 是以非线性方式编码的。)

2)如果您要进行数学运算,请先转换为floatorint32这样您就不会超出int16.

3)为了及时抵消,使用numpy切片。也就是说,类似new = old[1000:]+old[:-1000]. 请注意,您需要将相同长度的部分添加在一起,因此如果添加时移,则无法将其添加到完整数组中,因为时移会更短。

4)至于添加“随机时间”,您可以在上面添加一个随机时间。为了使时间在整个加法过程中不断变化,您需要扭曲原始信号,这将更加复杂。

于 2014-02-19T17:40:04.357 回答