0

我想获得一些音频的音色。

为了使用它,我将制作梅尔频率倒谱系数算法。

实现看起来很简单(我已经完成了第 1 步): 1. 对信号(窗口摘录)进行傅里叶变换。2. 使用三角形重叠窗口将上面获得的光谱的功率映射到梅尔标度上。3. 记录每个梅尔频率的功率对数。4. 对 mel 对数幂的列表进行离散余弦变换,就好像它是一个信号一样。5. MFCC 是所得频谱的幅度。

在第 2 步中,我知道如何从频率传递到 mel 比例,但我不知道三角形重叠窗口是什么意思..

如何正确执行此步骤?三角形重叠窗口是什么意思?

4

1 回答 1

0

完成到 mel 刻度的转换后,应用一组沿此刻度均匀分布的重叠三角形滤波器(因此低频间隔更近)。也就是说,在这里,您将从 FFT 返回的大致连续曲线变为一组离散的 20-50 个离散值。

我四处搜索过滤器的图片,并在此处此处(第 4 页)找到了一些(均为 pdf 格式)。这些还详细描述了他们如何进行计算的其他细节。

于 2009-10-26T02:31:53.817 回答