问题标签 [cmusphinx]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
285 浏览

voice-recognition - 语音依赖语音识别

我正在为嵌入式设备的语音相关语音识别解决方案寻找解决方案。我看过pocketsphinx,但因为我仍然不熟悉它,我想也许更有经验的人可能知道。是否可以使用pocketsphinx 来实现这样的语音识别。它应该记录音频,提取其特征,然后将其与所说的任何内容相匹配,而不是使用声学和语言模型。是否可以使用 pocketsphinx 来实现这个流程?如果不是,有人可以为我指出这样一个解决方案的正确方向吗?谢谢你。

0 投票
1 回答
720 浏览

android - 在 Windows 上的 Android 上构建 Pocketsphinx

我已经在android上关注这个Building Pocketsphinx好几天了,我很困惑现在该怎么做。我会一步一步地告诉我我做了什么,这样你就会知道我做错了什么。

我正在使用 Windows 7 64 位。

首先我已经下载了 PocketSphinxSphinxbase并且我已经将它解压到C:\Sphinx. 然后我只从MINGW DOWNLOAD下载了mingw。在我下载了这些东西之后,我启动了 mingw.exe,作为一个业余爱好者,我只尝试过,但没有做任何事情,所以我转到下一个安装swig的说明。sudo -i

我试着打字apt-get install swig,和yum install swig上次一样,它不起作用。然后我试过mingw-get install swig了,结果是mingw-get.exe: *** ERROR *** swig: unknown package。因此,我再次尝试了 sphinxbase 的下一个指令安装。

在安装 sphinxbase 时,我去了 sphinxbase 目录 -C:\Sphinx\sphinxbase我输入了./autogen.sh. 因此,它编译没有问题,我输入./configure它编译得也很好。接下来是make我遇到问题的地方,它已编译但出现错误。错误是:

这是我到目前为止遇到的问题。然后我尝试pio.lopio.lo download 下载。所以它修复了错误,但出现了另一个错误。第二个错误:

这就是我卡住的地方。我试过复制sphinx_fe之后sphinxbase-0.7-win32.zip没有任何反应。编译只会删除sphinx_fe.exe.

我的问题是我现在应该做什么?

如果不清楚,请随时发表评论和询问。感谢您的帮助。

0 投票
2 回答
1109 浏览

speech-recognition - 扩展 Sphinx 以支持本地语言

最初我正在考虑从头开始编写一个语音识别引擎(支持 50-100 个单词)来支持我的母语。

然而,经过一些研究,很明显,即使在 1.5 年内支持非常有限,也无法制造出语音识别引擎。

现在我正在考虑扩展 sphinx 引擎以支持我的语言。是否有可能在 1.5 年内完成,甚至这对于最后一年的项目来说工作量太大了。

我正在焦急地等待你在这件事上的经验。

0 投票
3 回答
1672 浏览

java - 如何使用 sphinx 从 JSGF 语法中检索标签?

我用 Java 编写了一个应用程序,它利用 CloudGarden API 来解析 JSAPI 语法,从语法规则返回标签,然后相应地处理这些标签。CloudGarden API 的问题在于它对 Windows 的依赖。我需要一个可以执行相同任务的跨平台库。我不需要语音合成,也不需要语音识别。本质上,一个字符串被传递给包含一些转录语音的程序。我需要针对我的语法文件解析这个字符串以检索动作标签(JSGF 语法规则中 { } 之间的文本)。然后我的程序使用检索到的动作标签来执行其他功能。

我一直在寻找一个可以解析符合 JSAPI 的 JSGF 语法文件的免费库。我发现的唯一现实的替代方案是语音识别引擎 Sphinx/CMUSphinx。我一直在研究 Sphinx,它把我带到了他们文档中的 ActionTagsParser 类。我不知道如何解析语法和检索标签。谁能指出我正确的方向或向我解释?

谢谢你,诺亚

编辑:

是否需要为要解析的语法配置 Sphinx?在以下代码中,RuleParse 始终计算为 NULL。RuleGrammar 和文本是有效的。

0 投票
0 回答
206 浏览

java - 狮身人面像 4 大楼。阿帕奇蚂蚁

我正在尝试在我的电脑上构建 sphinx-4 程序,但我被困在这一步。

要构建 Sphinx-4,在命令提示符处切换到安装 Sphinx-4 的目录(通常,一个简单的“cd sphinx4”就可以了)。设置所需的环境变量。JAVA_HOME 指向 JDK 的位置,ANT_HOME 指向 ant 的位置,PATH 包括 JDK 的 bin 子文件夹和 ant 变量的 bin 子文件夹。

有人可以告诉我该怎么做吗?

0 投票
0 回答
328 浏览

java - 使用 Sphinx 调用 RuleGrammar.listRuleNames() 时出现 StackOverflowError

我正在使用 Sphinx 解析语法文件。

我有一个加载所有语法文件的函数。此函数在程序开始时调用,并且每次用户请求reload. 最初调用时,它可以工作。当StackOverflowError随后调用此函数时会出现 。函数中导致错误的特定行是该gram.listRuleNames()行,特别是RuleGrammar listRuleNames().

有谁知道为什么会发生这种情况?

功能:

错误:

经过一些调试后,我注意到这recognizer.deleteRuleGrammar(rg)并没有删除旧语法。

我已将其缩小到loadJSGF()当调用两次时会导致StackOverflowError. 我认为这与识别器不删除旧语法有关。

0 投票
1 回答
1313 浏览

web-services - 用于 Web 应用程序的 CMUSphinx

我正在尝试创建一个基于语音识别的网络。经过一番搜索,我发现 cmusphinx 是一个非常适合语音识别应用程序的库。我的问题是 cmusphinx 和 web 之间如何通信?对不起,如果这是一个愚蠢的问题。

感谢你的帮助 !

0 投票
1 回答
2030 浏览

android - 如何在 PocketSphinx 中可靠地拒绝不合语法的单词

我在 Android 上成功使用了 PocketsphinxDemo。我有一组非常有限的单词要识别,说 3 个不同的单词。我目前得到很多误报——说话时,Pocketsphinx 认出了我的三个词之一,尽管它们没有被说出来。

由于我找不到任何关于 pocketsphinx 正在使用的参数的参考,这是我的问题:

是否有一个参数可以让 Pocketsphinx 做出更严格的反应?

我希望它仅在 Pocketsphinx 高度“确定”匹配正确的单词时返回其识别猜测。

以下是我目前使用的默认参数:

0 投票
1 回答
2864 浏览

audio - 用于语音/说话人识别的 CMU Sphinx

我正在寻找一种方法来匹配已知数据集,比如说 MP3 或 wav 文件列表,每个文件都是某人说​​话的样本。在这一点上,我知道文件 ABC 是关于人 X 说话的。

然后,我想再取一个样本,并进行一些语音匹配,以根据当时已知的数据集显示这个语音最有可能是谁。

另外,我不一定在乎对方说了什么,只要我能找到匹配的,即我不需要任何转录或其他方式。

我知道 CMU Sphinx 不做语音识别,它主要用于语音到文本,但我见过其他系统,例如:LIUM Speaker Diarization (http://cmusphinx.sourceforge.net/wiki/ Speakerdiarization)或 VoiceID 项目(https://code.google.com/p/voiceid/),它使用 CMU 作为此类工作的基础。

如果我要使用 CMU,我该如何进行语音匹配?

另外,如果 CMU Sphinx 不是最好的框架,有没有开源的替代方案?

0 投票
3 回答
26002 浏览

python - 使用 Python 和 Pocketsphinx 进行实时识别

我最近一直在使用 python 中的袖珍狮身人面像。我已经成功地得到了下面的例子来识别录制的 wav。

问题是如何通过麦克风进行实时语音识别?在带有 if 语句的 while 循环中,如果从麦克风中识别出一组单词,则可以调用函数?