10

我试图弄清楚如何将 sphinx4 或 pocketsphinx 与英语 voxforge 模型一起使用,但我无法让它工作。我曾尝试阅读文档页面(例如这个http://cmusphinx.sourceforge.net/sphinx4/doc/UsingSphinxTrainModels.html),但它对我没有帮助。

我想要的是一个可执行文件,我可以在其中指定要使用的模型以及要用作源的音频文件,并让可执行文件打印出来,这是对录音中声音的最佳猜测。

我有一些运气:pocketsphinx_continuous -infile recording.wav 2> /dev/null

但它在完整的音频文件被转录之前就中止了,并且默认模型只有很少的单词才能从音频中创建可读的文本。

我已经编译并测试了 sphinx4 源代码包中的演示,但所有示例似乎都只有几句话,需要一个模型 loke voxforge 对我有用。

我该如何设置?

4

1 回答 1

10

插入 Voxforge 声学模型非常简单。涵盖 API 的主要文档是 cmusphinx 教程:

http://cmusphinx.sourceforge.net/wiki/tutorialsphinx4

建议在开始之前阅读它。另请注意,建议使用 En_US English Generic 声学模型,它比 Voxforge 更准确。

您需要逐步执行以下操作:

  • 下载voxforge 模型并将其解压到一个文件夹中
  • 从github签出 sphinx4签出 sphinx4并使用 gradle 构建它
  • 运行转录器演示
  • 进入 sphinx4-samples/src/main/java/edu/cmu/sphinx/demo/transcriber 文件夹,打开Transcriber demo 并编辑声学模型路径如下。
  • 如果您需要另一个音频文件,请在源中编辑音频文件的位置
  • 再次运行演示并享受

就是这样

   // Load model from the folder in your project
   configuration.setAcousticModelPath("file:voxforge-en-0.4/model_parameters/voxforge_en_sphinx.cd_cont_5000");
于 2012-01-02T09:41:33.267 回答