5

我希望能够使用 Android 的 Speech-To-Text 引擎来识别句子中各种不寻常的单词。

举个例子,“脑电图”这个词来自 STT 作为“电子供应图”。当我使用 Soundex 或 Metaphone 将所说的内容与硬编码值进行比较时,该值似乎永远不会匹配或随机匹配。如果我使用阈值(例如,Math.abs(str1.compareTo(str2)) <= 1),那么匹配会变得非常松散,几乎任何东西都会匹配。

本质上,我想做的类似于通过背诵报价从报价数据库中查找报价。问题似乎更多地在于 Google 的 Speech-To-Text 引擎使用的有限词集。

有任何想法吗?

4

1 回答 1

3

您可以尝试使用或不使用基于语法的语音识别的CMUSphinx 。

查看Inimesed应用程序。这是一个开源的 Android 应用程序,它使用 CMUSphinx 进行基于 JSGF 的语音识别。在这种情况下,语法是根据用户的通讯录编译的。您可以简单地丢弃这部分并拥有包含所有短语的固定语法。

如果问题更多是你有包含偶尔不寻常单词的自由形式的句子,那么基于语法的语音识别可能不起作用。在这种情况下,使用 n-gram 语言模型进行识别,但在字典中包含所有不寻常的单词。

于 2013-01-29T12:55:36.660 回答