问题标签 [cmusphinx]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
voice-recognition - 语音依赖语音识别
我正在为嵌入式设备的语音相关语音识别解决方案寻找解决方案。我看过pocketsphinx,但因为我仍然不熟悉它,我想也许更有经验的人可能知道。是否可以使用pocketsphinx 来实现这样的语音识别。它应该记录音频,提取其特征,然后将其与所说的任何内容相匹配,而不是使用声学和语言模型。是否可以使用 pocketsphinx 来实现这个流程?如果不是,有人可以为我指出这样一个解决方案的正确方向吗?谢谢你。
android - 在 Windows 上的 Android 上构建 Pocketsphinx
我已经在android上关注这个Building Pocketsphinx好几天了,我很困惑现在该怎么做。我会一步一步地告诉我我做了什么,这样你就会知道我做错了什么。
我正在使用 Windows 7 64 位。
首先我已经下载了 PocketSphinx和Sphinxbase并且我已经将它解压到C:\Sphinx
. 然后我只从MINGW DOWNLOAD下载了mingw。在我下载了这些东西之后,我启动了 mingw.exe,作为一个业余爱好者,我只尝试过,但没有做任何事情,所以我转到下一个安装swig的说明。sudo -i
我试着打字apt-get install swig
,和yum install swig
上次一样,它不起作用。然后我试过mingw-get install swig
了,结果是mingw-get.exe: *** ERROR *** swig: unknown package
。因此,我再次尝试了 sphinxbase 的下一个指令安装。
在安装 sphinxbase 时,我去了 sphinxbase 目录 -C:\Sphinx\sphinxbase
我输入了./autogen.sh
. 因此,它编译没有问题,我输入./configure
它编译得也很好。接下来是make
我遇到问题的地方,它已编译但出现错误。错误是:
这是我到目前为止遇到的问题。然后我尝试pio.lo
从pio.lo download 下载。所以它修复了错误,但出现了另一个错误。第二个错误:
这就是我卡住的地方。我试过复制sphinx_fe
之后sphinxbase-0.7-win32.zip
没有任何反应。编译只会删除sphinx_fe.exe
.
我的问题是我现在应该做什么?
如果不清楚,请随时发表评论和询问。感谢您的帮助。
speech-recognition - 扩展 Sphinx 以支持本地语言
最初我正在考虑从头开始编写一个语音识别引擎(支持 50-100 个单词)来支持我的母语。
然而,经过一些研究,很明显,即使在 1.5 年内支持非常有限,也无法制造出语音识别引擎。
现在我正在考虑扩展 sphinx 引擎以支持我的语言。是否有可能在 1.5 年内完成,甚至这对于最后一年的项目来说工作量太大了。
我正在焦急地等待你在这件事上的经验。
java - 如何使用 sphinx 从 JSGF 语法中检索标签?
我用 Java 编写了一个应用程序,它利用 CloudGarden API 来解析 JSAPI 语法,从语法规则返回标签,然后相应地处理这些标签。CloudGarden API 的问题在于它对 Windows 的依赖。我需要一个可以执行相同任务的跨平台库。我不需要语音合成,也不需要语音识别。本质上,一个字符串被传递给包含一些转录语音的程序。我需要针对我的语法文件解析这个字符串以检索动作标签(JSGF 语法规则中 { } 之间的文本)。然后我的程序使用检索到的动作标签来执行其他功能。
我一直在寻找一个可以解析符合 JSAPI 的 JSGF 语法文件的免费库。我发现的唯一现实的替代方案是语音识别引擎 Sphinx/CMUSphinx。我一直在研究 Sphinx,它把我带到了他们文档中的 ActionTagsParser 类。我不知道如何解析语法和检索标签。谁能指出我正确的方向或向我解释?
谢谢你,诺亚
编辑:
是否需要为要解析的语法配置 Sphinx?在以下代码中,RuleParse 始终计算为 NULL。RuleGrammar 和文本是有效的。
java - 狮身人面像 4 大楼。阿帕奇蚂蚁
我正在尝试在我的电脑上构建 sphinx-4 程序,但我被困在这一步。
要构建 Sphinx-4,在命令提示符处切换到安装 Sphinx-4 的目录(通常,一个简单的“cd sphinx4”就可以了)。设置所需的环境变量。JAVA_HOME 指向 JDK 的位置,ANT_HOME 指向 ant 的位置,PATH 包括 JDK 的 bin 子文件夹和 ant 变量的 bin 子文件夹。
有人可以告诉我该怎么做吗?
java - 使用 Sphinx 调用 RuleGrammar.listRuleNames() 时出现 StackOverflowError
我正在使用 Sphinx 解析语法文件。
我有一个加载所有语法文件的函数。此函数在程序开始时调用,并且每次用户请求reload
. 最初调用时,它可以工作。当StackOverflowError
随后调用此函数时会出现 。函数中导致错误的特定行是该gram.listRuleNames()
行,特别是RuleGrammar listRuleNames()
.
有谁知道为什么会发生这种情况?
功能:
错误:
经过一些调试后,我注意到这recognizer.deleteRuleGrammar(rg)
并没有删除旧语法。
我已将其缩小到loadJSGF()
当调用两次时会导致StackOverflowError
. 我认为这与识别器不删除旧语法有关。
web-services - 用于 Web 应用程序的 CMUSphinx
我正在尝试创建一个基于语音识别的网络。经过一番搜索,我发现 cmusphinx 是一个非常适合语音识别应用程序的库。我的问题是 cmusphinx 和 web 之间如何通信?对不起,如果这是一个愚蠢的问题。
感谢你的帮助 !
android - 如何在 PocketSphinx 中可靠地拒绝不合语法的单词
我在 Android 上成功使用了 PocketsphinxDemo。我有一组非常有限的单词要识别,说 3 个不同的单词。我目前得到很多误报——说话时,Pocketsphinx 认出了我的三个词之一,尽管它们没有被说出来。
由于我找不到任何关于 pocketsphinx 正在使用的参数的参考,这是我的问题:
是否有一个参数可以让 Pocketsphinx 做出更严格的反应?
我希望它仅在 Pocketsphinx 高度“确定”匹配正确的单词时返回其识别猜测。
以下是我目前使用的默认参数:
audio - 用于语音/说话人识别的 CMU Sphinx
我正在寻找一种方法来匹配已知数据集,比如说 MP3 或 wav 文件列表,每个文件都是某人说话的样本。在这一点上,我知道文件 ABC 是关于人 X 说话的。
然后,我想再取一个样本,并进行一些语音匹配,以根据当时已知的数据集显示这个语音最有可能是谁。
另外,我不一定在乎对方说了什么,只要我能找到匹配的,即我不需要任何转录或其他方式。
我知道 CMU Sphinx 不做语音识别,它主要用于语音到文本,但我见过其他系统,例如:LIUM Speaker Diarization (http://cmusphinx.sourceforge.net/wiki/ Speakerdiarization)或 VoiceID 项目(https://code.google.com/p/voiceid/),它使用 CMU 作为此类工作的基础。
如果我要使用 CMU,我该如何进行语音匹配?
另外,如果 CMU Sphinx 不是最好的框架,有没有开源的替代方案?
python - 使用 Python 和 Pocketsphinx 进行实时识别
我最近一直在使用 python 中的袖珍狮身人面像。我已经成功地得到了下面的例子来识别录制的 wav。
问题是如何通过麦克风进行实时语音识别?在带有 if 语句的 while 循环中,如果从麦克风中识别出一组单词,则可以调用函数?