我正在开发一个应用程序,用户在其中阅读一些预定义的文本,我们使用语音识别引擎来记录他所说的内容。然后我们将结果与预定义的文本进行比较,以找出他正在阅读的句子或文本的一部分。
我们使用 Nuance NDev 作为我们的语音识别引擎,但现在成本太高,我们正在尝试寻找另一种替代方案。
所以我正在尝试使用 .NET 语音识别引擎,但我无法找到实现这一目标的方法。
根据我的测试:
听写语法很好,因为它可以翻译用户说的每个单词,但结果非常混乱,因此几乎不可能找到匹配项。
GrammarBuilder 和 Choises 类的混合更像是一个命令 => 动作类型的东西,它不会翻译用户说的所有单词,它只是搜索一个特定的单词/命令并打印出来。
所以我想知道是否有一种方法可以通过听写行为获得语法,但只能使用单词的子集,比如我预定义文本中的所有单词,或者让我设置单词/句子来帮助识别引擎的东西.
例如,如果我给引擎这个预定义的文本:
一天早上,当格里高尔·萨姆萨从噩梦中醒来时,他发现自己在床上变成了一只可怕的害虫。他躺在盔甲般的背上,稍微抬起头,就能看到棕色的腹部,略呈拱形,被拱门分成坚硬的部分。
它将只能从该文本中返回单词。所以识别会更容易,更准确。
如果您对如何实现此目标或任何其他替代方案有任何想法,我会全力以赴。唯一的限制是它必须支持英语和法语。
谢谢。