cmusphinx - 带有 VoxForge 的 CMU Sphinx 完全无法识别单词 - 为什么？

Question

我正在尝试设置 VoxForge 0.4 英语声学模型 - 如https://stackoverflow.com/a/8699337/519995中所述（但适用于原始配置而不是 XML）。当我切换到 VoxForge 时，我的错误率上升到 100%！

我得到的结果与输入声音完全不同。

我想我配置了一些错误，但我不知道是什么。

以下是我所做的修改（从 RawHelloNGram.java 演示开始）。

什么时候VOX_FORGE是假的，一切都很好，什么时候是真的，一切都无法识别。

this.modelLoader = new Sphinx3Loader(
            VOX_FORGE ? 
                  "file:"+PROJECT_DIR+"/voxforge-en-0.4/model_parameters/voxforge_en_sphinx.cd_cont_5000"
                : "resource:/WSJ_8gau_13dCep_16k_40mel_130Hz_6800Hz",
            "mdef",
            "",
            logMath,
            unitManager,
            0.0f,
            1e-7f,
            0.0001f,
            true);

    this.model = new TiedStateAcousticModel(modelLoader, unitManager, true);


// changed parameters of mel-Filter
 this.melFilterBank = new MelFrequencyFilterBank(
        VOX_FORGE ? 200.0  : 130.0,     // minFreq,
        VOX_FORGE ? 3500.0 : 6800.0,    // maxFreq,
        VOX_FORGE ? 31     : 40         // numberFilters
    );

 if (VOX_FORGE) {
    this.featureTransform = new FeatureTransform(
                modelLoader
    );
 }

...
... later at the end of the pipeline setup
if (VOX_FORGE) {
    pipeline.add(featureTransform);
}

为了完整性 - 这是我正在使用的整个配置：https ://gist.github.com/Iftahh/7336283

score 3 · Accepted Answer

Voxforge 使用标准的 mel 滤波器组参数（参见 feat.params）。

-nfilt 40
-lowerf 133.333334
-upperf 6855.4976

无需将 melfilterbank 设置为 200/3500/31

cmusphinx - 带有 VoxForge 的 CMU Sphinx 完全无法识别单词 - 为什么？

1 回答 1

Related

Reference