1

我正在做一个项目,我必须将 Pocketsphinx 的语音功能集成到一个 android 应用程序中。事实上,我必须集成Pocketpshinx提供的音素识别功能,它应该能够识别法语的音素,例如语音识别器应该能够识别音节(如“de”、“re”、“se”等)、辅音(如“m”、“f”、“g”等)、双辅音(如“kl”、“ks”、“gr”等)和元音(如“a”、“o” “e”等)。现在,我已经集成了用于识别上述音素的 Pocketsphinx,但我的结果非常糟糕。例如,当我发音“o”时,识别结果有时是:“SIL ff ei au” (即使我根本没有发音字母“f”和“e”),或者在开头出现了其他不发音的东西。开头出现的字母并不总是相同的(有时我会得到“ll”、“uu”等)。但有时,我发音的字母出现在开头(例如,对于“a”,我得到“SIL aa SIL”),但这种情况很少发生。那么,你们能否帮助并让我知道可能是什么问题以及解决此问题的任何建议?我是否需要仅使用我感兴趣的这些字母创建语言模型和字典(因为字母的数量是固定的)?或者,也许我需要做声学模型的适配,或者训练声学模型?或在开头出现其他不发音的东西。开头出现的字母并不总是相同的(有时我会得到“ll”、“uu”等)。但有时,我发音的字母出现在开头(例如,对于“a”,我得到“SIL aa SIL”),但这种情况很少发生。那么,你们能否帮助并让我知道可能是什么问题以及解决此问题的任何建议?我是否需要仅使用我感兴趣的这些字母创建语言模型和字典(因为字母的数量是固定的)?或者,也许我需要做声学模型的适配,或者训练声学模型?或在开头出现其他不发音的东西。开头出现的字母并不总是相同的(有时我会得到“ll”、“uu”等)。但有时,我发音的字母出现在开头(例如,对于“a”,我得到“SIL aa SIL”),但这种情况很少发生。那么,你们能否帮助并让我知道可能是什么问题以及解决此问题的任何建议?我是否需要仅使用我感兴趣的这些字母创建语言模型和字典(因为字母的数量是固定的)?或者,也许我需要做声学模型的适配,或者训练声学模型?你们能帮忙,让我知道可能是什么问题以及解决这个问题的任何建议吗?我是否需要仅使用我感兴趣的这些字母创建语言模型和字典(因为字母的数量是固定的)?或者,也许我需要做声学模型的适配,或者训练声学模型?你们能帮忙,让我知道可能是什么问题以及解决这个问题的任何建议吗?我是否需要仅使用我感兴趣的这些字母创建语言模型和字典(因为字母的数量是固定的)?或者,也许我需要做声学模型的适配,或者训练声学模型?

非常感谢您!

4

1 回答 1

1

在您的模型中找到 feat.params 并根据您的选择 更改-cmuinit值,此外,将“-kws_threshold”的值更改为1e-40f以消除误报。

于 2016-07-27T08:21:14.977 回答