mfcc - HTK 工具和采样率

Question

大家好。~~（这句话开头可以吗？）~~

我试图用 HTK 工具模拟语音（单词）识别。
我有 *.wav 文件。
有些文件有 16KHz 的采样率，有些文件有 44.1KHz 的采样率。

我制作了关于每个采样率的 mfcc 文件。
但是，我使用所有（16KHz 和 44.1KHz）mfcc 文件制作 HMM 模型。

voice_16KHz.wav -> voice_1.mfcc
voice_44.1KHz.wav -> voice_2.mfcc
make hmm_model using voice_1.mfcc and voice_2.mfcc

混合不同采样率的 HMM 模型可以吗？

我应该肯定知道信息，而不是建议。

谢谢阅读。

score 1 · Accepted Answer

我会建议你只选择一种采样率。它会起作用，但准确性会改变，而且您需要更改 MFCC 配置文件中的配置详细信息。将 44.1KHz 文件降级到 16KHz 非常容易。

1 回答 1