我整个上周都在搜索 MFCC 和相关问题。现在我可以从二维向量 coff[56][12] 中的 .wav 文件中获取 MFCC 特征,比方说。12 是我要提取的系数数,56 是帧数。根据我阅读的几篇文档,我们可以使用以上12个系数来识别语音(特别是我想识别单词“一”,“二”......到“十”)。但是现在我得到了 12 帧中的 56 帧,那么我应该使用 56 帧中的哪一个?
如果我有什么问题,请帮助我!!!
我整个上周都在搜索 MFCC 和相关问题。现在我可以从二维向量 coff[56][12] 中的 .wav 文件中获取 MFCC 特征,比方说。12 是我要提取的系数数,56 是帧数。根据我阅读的几篇文档,我们可以使用以上12个系数来识别语音(特别是我想识别单词“一”,“二”......到“十”)。但是现在我得到了 12 帧中的 56 帧,那么我应该使用 56 帧中的哪一个?
如果我有什么问题,请帮助我!!!