c# - .NET 预定义文本的语音识别

Question

我正在开发一个应用程序，用户在其中阅读一些预定义的文本，我们使用语音识别引擎来记录他所说的内容。然后我们将结果与预定义的文本进行比较，以找出他正在阅读的句子或文本的一部分。

我们使用 Nuance NDev 作为我们的语音识别引擎，但现在成本太高，我们正在尝试寻找另一种替代方案。

所以我正在尝试使用 .NET 语音识别引擎，但我无法找到实现这一目标的方法。

根据我的测试：

听写语法很好，因为它可以翻译用户说的每个单词，但结果非常混乱，因此几乎不可能找到匹配项。
GrammarBuilder 和 Choises 类的混合更像是一个命令 => 动作类型的东西，它不会翻译用户说的所有单词，它只是搜索一个特定的单词/命令并打印出来。

所以我想知道是否有一种方法可以通过听写行为获得语法，但只能使用单词的子集，比如我预定义文本中的所有单词，或者让我设置单词/句子来帮助识别引擎的东西.

例如，如果我给引擎这个预定义的文本：

一天早上，当格里高尔·萨姆萨从噩梦中醒来时，他发现自己在床上变成了一只可怕的害虫。他躺在盔甲般的背上，稍微抬起头，就能看到棕色的腹部，略呈拱形，被拱门分成坚硬的部分。

它将只能从该文本中返回单词。所以识别会更容易，更准确。

如果您对如何实现此目标或任何其他替代方案有任何想法，我会全力以赴。唯一的限制是它必须支持英语和法语。

谢谢。

score 1 · Accepted Answer

一种选择是通过互操作 C# 绑定从 CMUSphinx 尝试 pocketsphinx 引擎。它允许您指定从文本编译的语言模型，然后它会准确地检测单词。

提供法语和英语模型。

1 回答 1