1

语音识别是我当前项目的众多功能之一,最有可能在 J2EE 中开发(如果选择合理,也欢迎其他语言)。

googleSO上的大多数链接都建议上述三个选项,Sphinx 4、JSAPI 直接和 Google Speech API(对 google 进行服务器调用,而不是以文本形式获取结果)。

我还有哪些其他免费可用的选项?如果我使用 Sphinx-4,如何获得通用英语的语言模型?

4

2 回答 2

3

是的,有。

  1. 可以使用谷歌语音识别器的包装器,这是基本的一行代码。您发送 FLAC 或 SPEEX 格式的语音音频并接收识别和置信度分数。唯一的问题是谷歌可以像谷歌翻译一样关闭 API。
  2. 其他选择是使用 Sphinx(Sphinx4 或 Pocketsphinx)。
  3. 可以使用 HTK (http://htk.eng.cam.ac.uk/) 并使用 HVite (HTK 解码器) 或其他类似 Julius (http://julius.sourceforge.jp/en/)。还有其他选项使用 HTK 来训练声学模型和/或语言和语法。

Voxforge 拥有 HTK 和 Sphinx (http://voxforge.org/) 的声学和语言模型。

于 2011-12-29T16:52:04.773 回答
2

如果我使用 Sphinx-4,如何获得通用英语的语言模型?

您可以从 CMUSphinx 网站和其他地方下载它们。您也可以自己构建它们。可能的位置之一是

http://www.keithv.com/software/csr/

于 2012-01-04T22:57:06.747 回答