“cmusphinx”的相关标签问题

0 投票

1 回答

285 浏览

voice-recognition - 语音依赖语音识别

我正在为嵌入式设备的语音相关语音识别解决方案寻找解决方案。我看过pocketsphinx，但因为我仍然不熟悉它，我想也许更有经验的人可能知道。是否可以使用pocketsphinx 来实现这样的语音识别。它应该记录音频，提取其特征，然后将其与所说的任何内容相匹配，而不是使用声学和语言模型。是否可以使用 pocketsphinx 来实现这个流程？如果不是，有人可以为我指出这样一个解决方案的正确方向吗？谢谢你。

2012-12-04T09:18:13.607

0 投票

1 回答

720 浏览

android - 在 Windows 上的 Android 上构建 Pocketsphinx

我已经在android上关注这个Building Pocketsphinx好几天了，我很困惑现在该怎么做。我会一步一步地告诉我我做了什么，这样你就会知道我做错了什么。

我正在使用 Windows 7 64 位。

首先我已经下载了 PocketSphinx和Sphinxbase并且我已经将它解压到C:\Sphinx. 然后我只从MINGW DOWNLOAD下载了mingw。在我下载了这些东西之后，我启动了 mingw.exe，作为一个业余爱好者，我只尝试过，但没有做任何事情，所以我转到下一个安装swig的说明。sudo -i

我试着打字apt-get install swig，和yum install swig上次一样，它不起作用。然后我试过mingw-get install swig了，结果是mingw-get.exe: *** ERROR *** swig: unknown package。因此，我再次尝试了 sphinxbase 的下一个指令安装。

在安装 sphinxbase 时，我去了 sphinxbase 目录 -C:\Sphinx\sphinxbase我输入了./autogen.sh. 因此，它编译没有问题，我输入./configure它编译得也很好。接下来是make我遇到问题的地方，它已编译但出现错误。错误是：

这是我到目前为止遇到的问题。然后我尝试pio.lo从pio.lo download 下载。所以它修复了错误，但出现了另一个错误。第二个错误：

这就是我卡住的地方。我试过复制sphinx_fe之后sphinxbase-0.7-win32.zip没有任何反应。编译只会删除sphinx_fe.exe.

我的问题是我现在应该做什么？

如果不清楚，请随时发表评论和询问。感谢您的帮助。

android mingw cmusphinx

2012-12-04T12:56:20.103

0 投票

2 回答

1109 浏览

speech-recognition - 扩展 Sphinx 以支持本地语言

最初我正在考虑从头开始编写一个语音识别引擎（支持 50-100 个单词）来支持我的母语。

然而，经过一些研究，很明显，即使在 1.5 年内支持非常有限，也无法制造出语音识别引擎。

现在我正在考虑扩展 sphinx 引擎以支持我的语言。是否有可能在 1.5 年内完成，甚至这对于最后一年的项目来说工作量太大了。

我正在焦急地等待你在这件事上的经验。

speech-recognition voice-recognition cmusphinx sphinx4

2012-12-12T16:21:37.160

0 投票

3 回答

1672 浏览

java - 如何使用 sphinx 从 JSGF 语法中检索标签？

我用 Java 编写了一个应用程序，它利用 CloudGarden API 来解析 JSAPI 语法，从语法规则返回标签，然后相应地处理这些标签。CloudGarden API 的问题在于它对 Windows 的依赖。我需要一个可以执行相同任务的跨平台库。我不需要语音合成，也不需要语音识别。本质上，一个字符串被传递给包含一些转录语音的程序。我需要针对我的语法文件解析这个字符串以检索动作标签（JSGF 语法规则中 { } 之间的文本）。然后我的程序使用检索到的动作标签来执行其他功能。

我一直在寻找一个可以解析符合 JSAPI 的 JSGF 语法文件的免费库。我发现的唯一现实的替代方案是语音识别引擎 Sphinx/CMUSphinx。我一直在研究 Sphinx，它把我带到了他们文档中的 ActionTagsParser 类。我不知道如何解析语法和检索标签。谁能指出我正确的方向或向我解释？

谢谢你，诺亚

编辑：

是否需要为要解析的语法配置 Sphinx？在以下代码中，RuleParse 始终计算为 NULL。RuleGrammar 和文本是有效的。

java sphinx cmusphinx jsapi

2012-12-30T19:48:39.250

0 投票

0 回答

206 浏览

java - 狮身人面像 4 大楼。阿帕奇蚂蚁

我正在尝试在我的电脑上构建 sphinx-4 程序，但我被困在这一步。

要构建 Sphinx-4，在命令提示符处切换到安装 Sphinx-4 的目录（通常，一个简单的“cd sphinx4”就可以了）。设置所需的环境变量。JAVA_HOME 指向 JDK 的位置，ANT_HOME 指向 ant 的位置，PATH 包括 JDK 的 bin 子文件夹和 ant 变量的 bin 子文件夹。

有人可以告诉我该怎么做吗？

java ant speech-recognition cmusphinx sphinx4

2012-12-31T02:28:09.990

0 投票

0 回答

328 浏览

java - 使用 Sphinx 调用 RuleGrammar.listRuleNames() 时出现 StackOverflowError

我正在使用 Sphinx 解析语法文件。

我有一个加载所有语法文件的函数。此函数在程序开始时调用，并且每次用户请求reload. 最初调用时，它可以工作。当StackOverflowError随后调用此函数时会出现。函数中导致错误的特定行是该gram.listRuleNames()行，特别是RuleGrammar listRuleNames().

有谁知道为什么会发生这种情况？

功能：

错误：

经过一些调试后，我注意到这recognizer.deleteRuleGrammar(rg)并没有删除旧语法。

我已将其缩小到loadJSGF()当调用两次时会导致StackOverflowError. 我认为这与识别器不删除旧语法有关。

java stack-overflow cmusphinx jsapi

2012-12-31T03:45:50.550

0 投票

1 回答

1313 浏览

web-services - 用于 Web 应用程序的 CMUSphinx

我正在尝试创建一个基于语音识别的网络。经过一番搜索，我发现 cmusphinx 是一个非常适合语音识别应用程序的库。我的问题是 cmusphinx 和 web 之间如何通信？对不起，如果这是一个愚蠢的问题。

感谢你的帮助！

web-services web cmusphinx

2013-01-02T09:37:55.567

0 投票

1 回答

2030 浏览

android - 如何在 PocketSphinx 中可靠地拒绝不合语法的单词

我在 Android 上成功使用了 PocketsphinxDemo。我有一组非常有限的单词要识别，说 3 个不同的单词。我目前得到很多误报——说话时，Pocketsphinx 认出了我的三个词之一，尽管它们没有被说出来。

由于我找不到任何关于 pocketsphinx 正在使用的参数的参考，这是我的问题：

是否有一个参数可以让 Pocketsphinx 做出更严格的反应？

我希望它仅在 Pocketsphinx 高度“确定”匹配正确的单词时返回其识别猜测。

以下是我目前使用的默认参数：

android cmusphinx

2013-01-07T18:14:36.133

0 投票

1 回答

2864 浏览

audio - 用于语音/说话人识别的 CMU Sphinx

我正在寻找一种方法来匹配已知数据集，比如说 MP3 或 wav 文件列表，每个文件都是某人说话的样本。在这一点上，我知道文件 ABC 是关于人 X 说话的。

然后，我想再取一个样本，并进行一些语音匹配，以根据当时已知的数据集显示这个语音最有可能是谁。

另外，我不一定在乎对方说了什么，只要我能找到匹配的，即我不需要任何转录或其他方式。

我知道 CMU Sphinx 不做语音识别，它主要用于语音到文本，但我见过其他系统，例如：LIUM Speaker Diarization (http://cmusphinx.sourceforge.net/wiki/ Speakerdiarization）或 VoiceID 项目（https://code.google.com/p/voiceid/），它使用 CMU 作为此类工作的基础。

如果我要使用 CMU，我该如何进行语音匹配？

另外，如果 CMU Sphinx 不是最好的框架，有没有开源的替代方案？

audio pattern-matching speech-recognition voice-recognition cmusphinx

2013-01-10T00:37:29.433

0 投票

3 回答

26002 浏览

python - 使用 Python 和 Pocketsphinx 进行实时识别

我最近一直在使用 python 中的袖珍狮身人面像。我已经成功地得到了下面的例子来识别录制的 wav。

问题是如何通过麦克风进行实时语音识别？在带有 if 语句的 while 循环中，如果从麦克风中识别出一组单词，则可以调用函数？

python cmusphinx

2013-01-13T20:28:59.917

问题标签 [cmusphinx]

Reference