我想获得一些音频的音色。
为了使用它,我将制作梅尔频率倒谱系数算法。
实现看起来很简单(我已经完成了第 1 步): 1. 对信号(窗口摘录)进行傅里叶变换。2. 使用三角形重叠窗口将上面获得的光谱的功率映射到梅尔标度上。3. 记录每个梅尔频率的功率对数。4. 对 mel 对数幂的列表进行离散余弦变换,就好像它是一个信号一样。5. MFCC 是所得频谱的幅度。
在第 2 步中,我知道如何从频率传递到 mel 比例,但我不知道三角形重叠窗口是什么意思..
如何正确执行此步骤?三角形重叠窗口是什么意思?