1

我正在尝试使用 Sphinx II 实现语音识别器客户端,我的目标是让某人阅读文本中的书面句子,并对每个单词进行置信度评分。所以为此我使用有限状态语法和有限的字典。
我得到了一些工作,但信心得分非常低(< 0.30)。我使用的设置与 Sphinx 2 的简单 Reco 示例相同。由于每个发音的单词只有一种可能性(每个单词在语法中是一种状态),我通常应该有高分和高效的识别,但是假设需要时间来计算。我也得到了这个词一被发音的假设。所以现在我实际上不知道该去哪里改进这一点。我是否为此类问题使用了正确的解决方案?我应该改用语言模型吗?如果是,如何将上下文限制为故事中的给定句子?

我还需要使用狮身人面像训练器吗?到目前为止,我已经使用网络工具生成了语言模型/字典。

您的帮助将不胜感激。谢谢,鲍里斯·古根

4

0 回答 0