4

我目前处于语音识别的讨论阶段项目,我使用 MFCC 特征提取,但从函数返回的 MFCC 特征是一个矩阵,例如 每个语音文件(wav)的(20,38)特征矩阵。但是我怎样才能将此功能传递给 SVM 分类器。对于 SVM(和其他分类器),每个样本都由一个向量表示,对吧?但是每个样本的 MFCC 特征是一个矩阵。假设 Xi 是样本 i 的 MFCC 特征,那么样本 i 传递给 SVM 的特征是:1)一个 20*38 的向量,例如。Xi(:) 的 matlab 形式。2) 均值 (Xi)。3) Xi中的列或行之一。哪种方式是正确的?任何有用的代码,纸?

谢谢!闪耀

4

1 回答 1

6

对于语音识别等序列标记任务,您需要结合使用 SVM 和 HMM,而不仅仅是 SVM

  1. 使用 GMM-HMM 将特征矩阵与状态对齐,得到每个 HMM 状态对应的特征
  2. 在属于每个状态的特征上训练 SVM
  3. 用 SVM-HMM 代替 GMM-HMM

要了解更多信息,请阅读

http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.27.442

为了加快速度,请使用现有的工具包,例如:

http://www.cs.cornell.edu/people/tj/svm_light/svm_hmm.html

于 2013-03-02T07:26:15.167 回答