5

我想做梅尔频率倒谱算法,但有些事情我不明白。

完成 FTT 后,我们需要“使用三角形重叠窗口将上面获得的频谱的功率映射到 mel 标度上”。

我知道如何计算三角形,我也知道如何传递给 mel scale。我只是不知道该怎么处理他们。

如果定义了三角形,我如何将上面获得的光谱功率映射到梅尔尺度上?

是这样的:将三角形内的频率相加,然后将其传递给mel scale?或根据权重值(由该点的三角形高度定义)对三角形内的频率求和,然后将其传递给 mel scale?还是根据权重值将三角形内的所有频率传递给mel scale?另一件事?

任何人都可以向我澄清这一点

4

1 回答 1

5

我认为这个过程的这一步有点奇怪,而且不完全有意义(无论如何对我来说)。滤波器频带的中心沿梅尔刻度等距分布,但在线性刻度上是三角形,即就像这里的图一样。

然后使用这些三角形沿线性 x 轴计算加权和。(在上一步中,我认为某些方法会通过过滤器三角形的区域进行归一化,而有些则不会,老实说,我不确定这里的最终结果,尽管我怀疑除了修改最终解释无论如何都是相对比较。一个保持总能量,另一个给出每个波段的同等加权贡献。)然后取其对数(将整体体积因子转换为偏移量)。

编辑: 为了更清楚地应用过滤器......每个三角形代表一个单独的过滤器,产生一个单独的加权和。如果您的滤波器组中有 20 个滤波器,则将有 20 个三角形和 20 个加权和要计算。要应用每个过滤器,对于每个 x 轴值,将该 x 位置处的过滤器值乘以该 x 位置处的函数值,并将其添加到该特定过滤器的总和中。大多数 x 轴值都有两个过滤器,因此在每个 x 位置都会对两个过滤器做出贡献。

于 2009-10-28T20:52:16.180 回答