speech-recognition - 使用 CMU Shinx、JSAPI 和 Google Speech API 进行语音识别

Question

语音识别是我当前项目的众多功能之一，最有可能在 J2EE 中开发（如果选择合理，也欢迎其他语言）。

google和SO上的大多数链接都建议上述三个选项，Sphinx 4、JSAPI 直接和 Google Speech API（对 google 进行服务器调用，而不是以文本形式获取结果）。

我还有哪些其他免费可用的选项？如果我使用 Sphinx-4，如何获得通用英语的语言模型？

score 3 · Accepted Answer

是的，有。

可以使用谷歌语音识别器的包装器，这是基本的一行代码。您发送 FLAC 或 SPEEX 格式的语音音频并接收识别和置信度分数。唯一的问题是谷歌可以像谷歌翻译一样关闭 API。
其他选择是使用 Sphinx（Sphinx4 或 Pocketsphinx）。
可以使用 HTK (http://htk.eng.cam.ac.uk/) 并使用 HVite (HTK 解码器) 或其他类似 Julius (http://julius.sourceforge.jp/en/)。还有其他选项使用 HTK 来训练声学模型和/或语言和语法。

Voxforge 拥有 HTK 和 Sphinx (http://voxforge.org/) 的声学和语言模型。

score 2 · Accepted Answer

如果我使用 Sphinx-4，如何获得通用英语的语言模型？

您可以从 CMUSphinx 网站和其他地方下载它们。您也可以自己构建它们。可能的位置之一是

2 回答 2