2

我已经在我的 Windows XP 系统上安装了Sphinx-4并设置了 JSAPI。我想将英语口语 WAV(或 MP3)文件转录为文本。

当我运行“WavFile”演示时 - 它运行成功。

java -jar WavFile.jar

但是,当我像这样传递自己的 wav 文件时:

java -jar WavFile.jar c:\test.wav

我得到:

正在加载“jar:file:/C:/sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/WavFile.jar!/edu/cmu/sphinx/demo/wavfile/config.xml”中定义的识别器...

解码 jar:file:/C:/sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/WavFile.jar!/edu/cmu/sphinx/demo/wavfile/12345.wav 结果:一二三四五

似乎这个演示设置为加载和运行内部 wav 文件(“12345.wav”)或其他东西。

我已经阅读了文档,只是不知道如何设置“config.xml”,甚至不知道将其放置在哪个目录中。我只是想获得一个使用标准演示运行的简单概念证明。

所以,问题是:如何运行 Sphinx4 程序来转录 wav 文件?

谢谢。

4

3 回答 3

6

需要编写一个新应用程序(基于 Transcriber.java),它使用 CMU 字典(美式英语)而不是 Transcriber.jar 支持的数字。

奇怪的是,Sphinx 没有提供这么有用的样本。

于 2011-01-31T23:07:40.967 回答
1

我知道这是一个非常古老的线程,但我只是想指出您的示例似乎运行得很好。如果您查看输出的最后:

解码 jar:file:/C:/sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/WavFile.jar!/edu/cmu/sphinx/demo/wavfile/12345.wav 结果:一二三四五<= ========= 解码 WAV 音频的结果!

于 2014-04-25T14:38:12.980 回答
0

看看pocketsphinx 包。它是用 C 语言编写的,已针对每个平台进行编译,可用作命令行或应用程序的一部分。我一直在使用命令行,它非常通用。

于 2013-04-04T15:16:36.877 回答