问题标签 [cmusphinx]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
2718 浏览

performance - 调整 CMU Sphinx

我正在尝试构建一个基于 CMU Sphinx 的语音识别应用程序。我使用 lmtool 创建了自己的语言模型。但是为了提高识别的准确率,我想对Sphinx进行调优。但是对于选择absoluteBeamWidth、relativeBeamWidth、absoulteWordBeamWidth、languageWeight等属性是否有任何指导方针。我不确定这些属性是什么意思。此外,任何可以帮助我调整 Sphinx 的资源链接(不包括 sphinx 网站上不完整的调整链接)都将不胜感激。

谢谢

0 投票
3 回答
6572 浏览

java - 我怎样才能得到 jsapi.jar

我正在开发一个使用 CMU Sphinx4 的应用程序,但是当我尝试运行 PythonTranscriber 时出现以下错误:

我注意到目录:"/home/karen/sphinx4-1.0beta5-scr2/sphinx4-1.0beta/lib" 没有 jsapi.jar。我试图在另一个目录中寻找它,但我找不到它。

我怎样才能在目录中获取 jsapi.jar:"/home/karen/sphinx4-1.0beta5-scr2/sphinx4-1.0beta/lib" 它应该在那里!请帮忙!

0 投票
1 回答
372 浏览

speech-recognition - 固定的、小词汇量、语言无关的语音(或命令)识别

寻找任何低计算复杂度的识别引擎(希望是 FOSS),它适用于:

  1. 固定集/小词汇量(最多 100 个短语)
  2. 语言无关
  3. 不连续的语音/命令

没关系,如果引擎是:

  1. 依赖说话者
  2. (因此)需要先验训练(在可以执行识别之前)

我所说的低计算复杂度是指我希望能够在具有 64MB RAM 的 450MHz ARM9 SBC 上运行的东西。

0 投票
0 回答
293 浏览

java - 连接两个应用程序

我需要在它们运行时连接两个应用程序:CMU Sphinx4 和一个用 python 编写的程序。

我不想集成,只想在两个应用程序之间进行通信。

我想将 Sphinx 识别的行传递给.py文件。

我怎样才能做到这一点?

0 投票
2 回答
4051 浏览

java - CMU Sphinx 是否可以通过 Maven 获得?

我有一个可能需要 CMU Sphinx 的应用程序的想法,它可以通过 maven 获得,还是我需要手动添加?

0 投票
1 回答
554 浏览

android - 关于 PocketSphinxAndroidDemo

我关注这个网站:http ://cmusphinx.sourceforge.net/2011/05/building-pocketsphinx-on-android/ 。起初它工作正常。但是当我在文件 /jni/ 上 cmd ndk-build 时。错误显示如下:

0 投票
1 回答
373 浏览

java - 捕获来自 Ekiga 软电话/Pulseaudio JACK 接收器的传入音频

我想使用 Sphinx 进行语音识别。

我正在寻找使用 Java 或 Python 捕获 Ekiga VOIP 软件电话的输出/传入音频并将其传递给 Sphinx。现在,输出指向 PulseAudio JACK Sink。

抱歉,如果我没有使用正确的术语,因为我对此很陌生。

如果您能指出我正确的方向,将不胜感激,谢谢。

0 投票
1 回答
2248 浏览

python - PocketSphinx python 和设置声学模型?

我正在阅读这个关于语音识别的指南,它提到我需要三个语音识别项目:声学模型、语言模型、语音词典。

我想开始玩这个python 演示,它使用 Gstreamer 从麦克风捕获并重新采样为 8kHz、16 位 PCM 音频。

我看到我可以指定语言模型和拼音词典,我使用的是[由cmu提供]:

但我很困惑我应该在哪里指定声学模型?gstreamer 是否有我隐含使用的自己的声学模型?我希望使用此处提供的声学模型获得更好的结果:

(对不起超链接。我不能发布超过 2 个代表小于 10 的链接)

0 投票
1 回答
2221 浏览

java - 如何在 Windows 7(SphinxPocket)上运行 autogen.sh 和 swig

我一直在尝试为我的 android 应用程序构建 Pocketsphinx,但遇到了一些问题。

autogen.sh,运行 autogen.sh 的程序是什么?当我尝试在 cmd 中安装它时,它提示我选择一个程序来运行 autogen.sh。这是为什么?将 Pocketsphinx 构建到 Android ——我已经使用 mingw 运行了 autogen.sh,在我运行它之后我“make”但它得到了一个错误:

这个可以吗?如果不是,我该如何解决?

swig,我在 CMD中尝试了此处的说明,但是当我运行 swig 时,它显示“必须指定输入文件。使用 -help 获取可用选项。” 我如何知道是否安装了 Swig?

我正在使用MINWG来处理这个 sphinxpocket,但我仍然不知道如何使用 swig。

我正在使用 Windows 7 Home Basic 64 位。谢谢

0 投票
1 回答
10859 浏览

java - 为 CMU Sphinx 4 输入转换音频文件

我有一大堆文件想在使用 CMU Sphinx 4 时运行识别。Sphinx 需要以下格式:

  • 16 千赫兹
  • 16 位
  • 单核细胞增多症
  • 小端

我的文件类似于 44100 khz、32 位立体声 mp3 文件。我尝试使用 Tritonus,然后使用它的更新版本 JavaZoom,使用来自bakuzen的代码进行转换。但是,AudioSystem.getAudioInputStream(File)抛出一个UnsupportedAudioFileException,我无法弄清楚为什么,所以我继续前进。

现在我正在尝试 ffmpeg。该命令ffmpeg -i input.mp3 -ac 1 -ab 16 -ar 16000 output.wav似乎应该可以解决问题(小端除外),但是当我使用 Audacity 检查输出时,它仍然将其标记为“32 位浮点数”。我在这个网站上找到的命令也使用-acodec pcm_s16le了 ,从它的名字看似乎是输出 16 位小端;但是,Audacity 仍然告诉我输出是32 bit float.

谁能告诉我如何将音频文件转换为 CMU Sphinx 4 所需的格式?