大家好。(这句话开头可以吗?)
我试图用 HTK 工具模拟语音(单词)识别。
我有 *.wav 文件。
有些文件有 16KHz 的采样率,有些文件有 44.1KHz 的采样率。
我制作了关于每个采样率的 mfcc 文件。
但是,我使用所有(16KHz 和 44.1KHz)mfcc 文件制作 HMM 模型。
voice_16KHz.wav -> voice_1.mfcc
voice_44.1KHz.wav -> voice_2.mfcc
make hmm_model using voice_1.mfcc and voice_2.mfcc
混合不同采样率的 HMM 模型可以吗?
我应该肯定知道信息,而不是建议。
谢谢阅读。