0

我已经成功提取了 MFCC 系数,并且得到了以下值

  -15.2366
    6.4996
   -2.1807
    0.2495
   -1.3403
    0.9815
   -0.1106
    1.7914
    0.7311
    1.1881
    1.3340
    2.6080
    1.4208
    2.0144
    0.5085
   -1.1236
   -1.2728
   -0.9470
   -0.8139
    0.8987
    1.6006
    1.6000
    0.4638
    0.3747
    0.0670
   -0.0620
    0.6234
    0.0614
    0.0964
    0.2334
   -0.2188
    0.0591
    0.6765
    0.3943
   -0.1409
    0.1894
    0.0004
   -0.4762
   -0.1273
    0.1655
   -0.0649
   -0.2606
    0.0075
   -0.1275
   -0.2038
   -0.1332
    0.2084
    0.5128
    0.8877
    0.5406

现在如何从这些值中提取特征。谢谢

4

1 回答 1

0

MFCC 已经是您必须用来训练识别引擎(通常是 HMM)的功能。

但是,您是如何提取这些特征的?我假设该向量代表您正在处理的音频文件中单个 100 毫秒窗口的 MFCC,因为典型的 MFCC 看起来像一个 N×M 矩阵。N 是您用于提取特征的窗口数,M 取决于您提取 MFCC 的方式(通常 M=39)。

于 2014-03-19T10:24:07.470 回答