问题标签 [cmusphinx]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

685 问题

0 投票

1 回答

2718 浏览

performance - 调整 CMU Sphinx

我正在尝试构建一个基于 CMU Sphinx 的语音识别应用程序。我使用 lmtool 创建了自己的语言模型。但是为了提高识别的准确率，我想对Sphinx进行调优。但是对于选择absoluteBeamWidth、relativeBeamWidth、absoulteWordBeamWidth、languageWeight等属性是否有任何指导方针。我不确定这些属性是什么意思。此外，任何可以帮助我调整 Sphinx 的资源链接（不包括 sphinx 网站上不完整的调整链接）都将不胜感激。

谢谢

2012-11-13T11:49:54.063

0 投票

3 回答

6572 浏览

java - 我怎样才能得到 jsapi.jar

我正在开发一个使用 CMU Sphinx4 的应用程序，但是当我尝试运行 PythonTranscriber 时出现以下错误：

我注意到目录："/home/karen/sphinx4-1.0beta5-scr2/sphinx4-1.0beta/lib" 没有 jsapi.jar。我试图在另一个目录中寻找它，但我找不到它。

我怎样才能在目录中获取 jsapi.jar："/home/karen/sphinx4-1.0beta5-scr2/sphinx4-1.0beta/lib" 它应该在那里！请帮忙！

java python jython cmusphinx

2012-11-14T22:56:13.540

0 投票

1 回答

372 浏览

speech-recognition - 固定的、小词汇量、语言无关的语音（或命令）识别

寻找任何低计算复杂度的识别引擎（希望是 FOSS），它适用于：

固定集/小词汇量（最多 100 个短语）
语言无关
不连续的语音/命令

没关系，如果引擎是：

依赖说话者
（因此）需要先验训练（在可以执行识别之前）

我所说的低计算复杂度是指我希望能够在具有 64MB RAM 的 450MHz ARM9 SBC 上运行的东西。

speech-recognition speech cmusphinx

2012-11-19T05:11:49.343

0 投票

0 回答

293 浏览

java - 连接两个应用程序

我需要在它们运行时连接两个应用程序：CMU Sphinx4 和一个用 python 编写的程序。

我不想集成，只想在两个应用程序之间进行通信。

我想将 Sphinx 识别的行传递给.py文件。

我怎样才能做到这一点？

java python voice-recognition cmusphinx

2012-11-19T22:50:05.293

0 投票

2 回答

4051 浏览

java - CMU Sphinx 是否可以通过 Maven 获得？

我有一个可能需要 CMU Sphinx 的应用程序的想法，它可以通过 maven 获得，还是我需要手动添加？

java maven cmusphinx

2012-11-21T05:43:06.760

0 投票

1 回答

554 浏览

android - 关于 PocketSphinxAndroidDemo

我关注这个网站：http ://cmusphinx.sourceforge.net/2011/05/building-pocketsphinx-on-android/ 。起初它工作正常。但是当我在文件 /jni/ 上 cmd ndk-build 时。错误显示如下：

android ubuntu cmusphinx

2012-11-22T14:28:54.783

0 投票

1 回答

373 浏览

java - 捕获来自 Ekiga 软电话/Pulseaudio JACK 接收器的传入音频

我想使用 Sphinx 进行语音识别。

我正在寻找使用 Java 或 Python 捕获 Ekiga VOIP 软件电话的输出/传入音频并将其传递给 Sphinx。现在，输出指向 PulseAudio JACK Sink。

抱歉，如果我没有使用正确的术语，因为我对此很陌生。

如果您能指出我正确的方向，将不胜感激，谢谢。

java voip cmusphinx

2012-11-27T08:48:23.813

0 投票

1 回答

2248 浏览

python - PocketSphinx python 和设置声学模型？

我正在阅读这个关于语音识别的指南，它提到我需要三个语音识别项目：声学模型、语言模型、语音词典。

我想开始玩这个python 演示，它使用 Gstreamer 从麦克风捕获并重新采样为 8kHz、16 位 PCM 音频。

我看到我可以指定语言模型和拼音词典，我使用的是[由cmu提供]：

但我很困惑我应该在哪里指定声学模型？gstreamer 是否有我隐含使用的自己的声学模型？我希望使用此处提供的声学模型获得更好的结果：

（对不起超链接。我不能发布超过 2 个代表小于 10 的链接）

python speech-recognition cmusphinx

2012-11-30T21:22:48.523

0 投票

1 回答

2221 浏览

java - 如何在 Windows 7（SphinxPocket）上运行 autogen.sh 和 swig

我一直在尝试为我的 android 应用程序构建 Pocketsphinx，但遇到了一些问题。

autogen.sh，运行 autogen.sh 的程序是什么？当我尝试在 cmd 中安装它时，它提示我选择一个程序来运行 autogen.sh。这是为什么？将 Pocketsphinx 构建到 Android ——我已经使用 mingw 运行了 autogen.sh，在我运行它之后我“make”但它得到了一个错误：

这个可以吗？如果不是，我该如何解决？

swig，我在 CMD中尝试了此处的说明，但是当我运行 swig 时，它显示“必须指定输入文件。使用 -help 获取可用选项。” 我如何知道是否安装了 Swig？

我正在使用MINWG来处理这个 sphinxpocket，但我仍然不知道如何使用 swig。

我正在使用 Windows 7 Home Basic 64 位。谢谢

java android windows cmd cmusphinx

2012-12-03T01:45:23.290

0 投票

1 回答

10859 浏览

java - 为 CMU Sphinx 4 输入转换音频文件

我有一大堆文件想在使用 CMU Sphinx 4 时运行识别。Sphinx 需要以下格式：

16 千赫兹
16 位
单核细胞增多症
小端

我的文件类似于 44100 khz、32 位立体声 mp3 文件。我尝试使用 Tritonus，然后使用它的更新版本 JavaZoom，使用来自bakuzen的代码进行转换。但是，AudioSystem.getAudioInputStream(File)抛出一个UnsupportedAudioFileException，我无法弄清楚为什么，所以我继续前进。

现在我正在尝试 ffmpeg。该命令ffmpeg -i input.mp3 -ac 1 -ab 16 -ar 16000 output.wav似乎应该可以解决问题（小端除外），但是当我使用 Audacity 检查输出时，它仍然将其标记为“32 位浮点数”。我在这个网站上找到的命令也使用-acodec pcm_s16le了，从它的名字看似乎是输出 16 位小端；但是，Audacity 仍然告诉我输出是32 bit float.

谁能告诉我如何将音频文件转换为 CMU Sphinx 4 所需的格式？

java audio ffmpeg speech-recognition cmusphinx

2012-12-03T22:36:15.840

1 2 3 4 5 6 7 8 9 10

问题标签 [cmusphinx]

Reference