1


大家好。(这句话开头可以吗?)

我试图用 HTK 工具模拟语音(单词)识别。
我有 *.wav 文件。
有些文件有 16KHz 的采样率,有些文件有 44.1KHz 的采样率。

我制作了关于每个采样率的 mfcc 文件。
但是,我使用所有(16KHz 和 44.1KHz)mfcc 文件制作 HMM 模型。

voice_16KHz.wav -> voice_1.mfcc
voice_44.1KHz.wav -> voice_2.mfcc
make hmm_model using voice_1.mfcc and voice_2.mfcc

混合不同采样率的 HMM 模型可以吗?

我应该肯定知道信息,而不是建议。

谢谢阅读。

4

1 回答 1

1

我会建议你只选择一种采样率。它会起作用,但准确性会改变,而且您需要更改 MFCC 配置文件中的配置详细信息。将 44.1KHz 文件降级到 16KHz 非常容易。

于 2016-08-05T07:11:01.627 回答