1

我想实现一个 HMM(隐马尔可夫模型)来识别特定的单词。到目前为止,我已经设法提取了信号的系数 (MFCC),并想知道这是否是训练 HMM 的好数据?

此外,训练 HMM 的格式(如下)是否正确?

格式:

对于每个样本,都有一系列 MFCC 系数,我提供了其中两个样本作为示例...

-13.8033 0.645476 3.2174 -0.625136 -0.470134 -2.96368 0.701151 0.464246 1.1898 -1.88515 0.0805242 0.311573 0.732487

-19.4252 -5.65454 0.853437 0.317219 0.146167 -1.93742 0.381944 -2.01793 -0.561144 -0.896783 -0.105491 -1.06504 -0.797318

希望有人可以提供帮助:)

4

1 回答 1

1

你可以有两种方法。

一种是对这些向量进行向量量化,以便将连续 MFCC 向量转换为 HMM 的离散观测值。

其他是使用连续方法在 HMM 中进行训练。你可以在这个线程中看到更多:

从零开始的简单语音识别

于 2014-06-20T19:33:22.857 回答