4

我正在寻找一个更像 android 版本的 Java 语音识别软件,因为它没有 .gram 文件和东西,它只返回一个所说的字符串,我可以对其采取行动。我尝试过使用 sphinx-4,但使用 .gram 文件会使我的程序更难执行。

4

1 回答 1

3

语法文件的重点是提高您返回的内容的准确性。与其尝试想出随机的英文单词串,不如告诉它期待特定的输入。

也就是说,sphinx-4 也可以执行普通的大字典 ASR。阅读本教程的 N-Gram 部分并查看 sphinx 源代码附带的转录器示例。

此外,您可以训练自己的三元模型,这将增强您获得的结果。(例如,将更多的概率放在检测到“天气”这个词上。)这当然是 Siri 所做的。苹果/谷歌有大量的音频片段,人们通过手机说话,其中一部分是人工转录的,他们从中训练声学和语言模型(因此他们的引擎检测人们通常说的话而不是胡说八道)。

于 2012-12-21T21:40:16.893 回答