2

我正在开发一个应用程序,用户在其中阅读一些预定义的文本,我们使用语音识别引擎来记录他所说的内容。然后我们将结果与预定义的文本进行比较,以找出他正在阅读的句子或文本的一部分。

我们使用 Nuance NDev 作为我们的语音识别引擎,但现在成本太高,我们正在尝试寻找另一种替代方案。

所以我正在尝试使用 .NET 语音识别引擎,但我无法找到实现这一目标的方法。

根据我的测试:

  • 听写语法很好,因为它可以翻译用户说的每个单词,但结果非常混乱,因此几乎不可能找到匹配项。

  • GrammarBuilder 和 Choises 类的混合更像是一个命令 => 动作类型的东西,它不会翻译用户说的所有单词,它只是搜索一个特定的单词/命令并打印出来。

所以我想知道是否有一种方法可以通过听写行为获得语法,但只能使用单词的子集,比如我预定义文本中的所有单词,或者让我设置单词/句子来帮助识别引擎的东西.

例如,如果我给引擎这个预定义的文本:

一天早上,当格里高尔·萨姆萨从噩梦中醒来时,他发现自己在床上变成了一只可怕的害虫。他躺在盔甲般的背上,稍微抬起头,就能看到棕色的腹部,略呈拱形,被拱门分成坚硬的部分。

它将只能从该文本中返回单词。所以识别会更容易,更准确。

如果您对如何实现此目标或任何其他替代方案有任何想法,我会全力以赴。唯一的限制是它必须支持英语法语

谢谢。

4

1 回答 1

1

一种选择是通过互操作 C# 绑定从 CMUSphinx 尝试 pocketsphinx 引擎。它允许您指定从文本编译的语言模型,然后它会准确地检测单词。

提供法语和英语模型。

于 2014-11-22T21:53:53.680 回答