java - 如何使用 CMU Sphinx 4 使用英语 voxforge 模型进行语音到文本

Question

我试图弄清楚如何将 sphinx4 或 pocketsphinx 与英语 voxforge 模型一起使用，但我无法让它工作。我曾尝试阅读文档页面（例如这个http://cmusphinx.sourceforge.net/sphinx4/doc/UsingSphinxTrainModels.html），但它对我没有帮助。

我想要的是一个可执行文件，我可以在其中指定要使用的模型以及要用作源的音频文件，并让可执行文件打印出来，这是对录音中声音的最佳猜测。

我有一些运气：pocketsphinx_continuous -infile recording.wav 2> /dev/null

但它在完整的音频文件被转录之前就中止了，并且默认模型只有很少的单词才能从音频中创建可读的文本。

我已经编译并测试了 sphinx4 源代码包中的演示，但所有示例似乎都只有几句话，需要一个模型 loke voxforge 对我有用。

我该如何设置？

score 10 · Accepted Answer

插入 Voxforge 声学模型非常简单。涵盖 API 的主要文档是 cmusphinx 教程：

http://cmusphinx.sourceforge.net/wiki/tutorialsphinx4

建议在开始之前阅读它。另请注意，建议使用 En_US English Generic 声学模型，它比 Voxforge 更准确。

您需要逐步执行以下操作：

下载voxforge 模型并将其解压到一个文件夹中
从github签出 sphinx4签出 sphinx4并使用 gradle 构建它
运行转录器演示
进入 sphinx4-samples/src/main/java/edu/cmu/sphinx/demo/transcriber 文件夹，打开Transcriber demo 并编辑声学模型路径如下。
如果您需要另一个音频文件，请在源中编辑音频文件的位置
再次运行演示并享受

就是这样

   // Load model from the folder in your project
   configuration.setAcousticModelPath("file:voxforge-en-0.4/model_parameters/voxforge_en_sphinx.cd_cont_5000");

java - 如何使用 CMU Sphinx 4 使用英语 voxforge 模型进行语音到文本

1 回答 1

Related

Reference