speech-recognition - Sphinx II 识别读取和识别

翻译自：https://stackoverflow.com/questions/1395411 2009-09-08T18:03:05.000

378 次

我正在尝试使用 Sphinx II 实现语音识别器客户端，我的目标是让某人阅读文本中的书面句子，并对每个单词进行置信度评分。所以为此我使用有限状态语法和有限的字典。
我得到了一些工作，但信心得分非常低（< 0.30）。我使用的设置与 Sphinx 2 的简单 Reco 示例相同。由于每个发音的单词只有一种可能性（每个单词在语法中是一种状态），我通常应该有高分和高效的识别，但是假设需要时间来计算。我也得到了这个词一被发音的假设。所以现在我实际上不知道该去哪里改进这一点。我是否为此类问题使用了正确的解决方案？我应该改用语言模型吗？如果是，如何将上下文限制为故事中的给定句子？

我还需要使用狮身人面像训练器吗？到目前为止，我已经使用网络工具生成了语言模型/字典。

您的帮助将不胜感激。谢谢，鲍里斯·古根

speech-recognition - Sphinx II 识别读取和识别

0 回答 0

Related

Reference