问题标签 [pocketsphinx]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
370 浏览

android - pocketsphinx 法语失败

我正在使用以下代码来设置识别器(应该让您了解使用的初始化操作和模型的顺序):

我收到以下错误 - 知道为什么吗?相同的代码适用于英文模型。

0 投票
0 回答
2014 浏览

java - 在 PocketSphinx 关键字检测的语法文件中设置阈值

我正在尝试完全按照该线程的作者所做/解决的事情:

使用 PocketSphinx 识别多个关键字

他说语法文件应该是这样的,以避免检测到不在语法文件中的单词:

....但如果它完全像这样,它就不起作用。我可以这样做:

但这不会改变任何东西,/1.0/ 也不会改变任何东西。它不断检测左/右的假词。

将阈值放在每个单词的右侧(如作者)会导致应用程序崩溃。

有人可以帮我吗?

更新:

我通过在函数 setupRecognizer(File assetsDir) 中使用 addKeywordSearch 解决了这个问题。在我的案例中,它仍然像 PocketSphinx-Demo addGrammarSearch 一样。为了完整起见(就像链接问题作者的 setupRecognizer 函数一样):

如果语法文件看起来(也像作者发布的那样)完全像这样,它就会起作用:

0 投票
2 回答
4290 浏览

android - Pocketsphinx VS 谷歌语音识别 API

我正在构建一个语音识别 android 应用程序,它将充当虚拟个人助理,执行以下任务:

预约/提醒

天气信息

对 Wolfram|Alpha / Wikipedia 的一般查询 - (即谁导演了捉鬼敢死队,英镑 - 美元汇率是多少)

我的问题是使用 Pocketsphinx 还是 Google API?

最初我使用“android.speech.RecognitionListener”进行设置,效果很好,但是我想实现关键字识别,这样用户除了说话之外不需要任何交互。

显然 Google API 不支持这一点,所以我研究了为此使用 pocketsphinx,并且仍然在应用程序的其余部分使用谷歌(因为我听说 pocketsphinx 不那么准确?)但是两者并没有像他们那样相处不要同时占用麦克风。

有没有在识别器之间切换的好方法?(甚至不能将两者都导入同一个项目)

我应该只使用pocketshinx并处理较低的准确性吗?

建议会有所帮助

干杯

0 投票
1 回答
2064 浏览

java - How to add phonemes recognition with pocketsphinx on Android

I'm working on a project about Cued Speech (it's a visual system of communication used with and among deaf or hard-of-hearing people). It is a phonemic-based system which makes traditionally spoken languages accessible by using a small number of handshapes, known as cues, (representing consonants) in different locations near the mouth (representing vowels), as a supplement to speechreading.

I already followed the tutorial about phonemes recognition (pocketsphinx_continuous), pocketsphinx on android and it's working. I'm working for now on Android but the final goal of this project is to make it work on Google glass. The best case is to write on the device the speech (closer as real time) and an avatar in 3D which will reproduce the correct hand configuration and lips mouvement according to the phoneme identified. (That's why i need to work with phonemes and not the word it self)

I read http://cmusphinx.sourceforge.net/wiki/phonemerecognition but i'm quite confuse about how to create my own "files" for french phonemes to make it works on Android.

What are the steps ? What kind of file should i create ?

In other words, is it possible to have the same result of pocketsphinx_continuous with phonemes on Android with voice input ?

I hope you can guide me !

Guillaume

0 投票
2 回答
467 浏览

c - Sphinxbase 制作/安装失败

我正在尝试在 Debian Jessie 上安装 sphinxbase 和 pocketsphinx,如本教程中所述,但make check在安装 sphinxbase 期间运行失败;我认为这导致我以后无法安装pocketsphinx。当我检查适当的日志时,它揭示了错误的来源:

我戳了一下 cmd_ln.ca,看起来有问题的行在与 win32 相关的#ifndef 中,这使它在这种情况下可能无关紧要?我不确定。

有没有其他人遇到过这个问题,或者其他人可以为我阐明这个问题吗?

0 投票
1 回答
625 浏览

cmusphinx - 使用 Sphinx 识别短语中口语单词的开始/停止时间

我正在尝试识别短语中单个单词的开始/结束时间。我有一个短语和话语文本的 WAV 文件。

有没有一种智能的方法可以结合这两种数据(音频、文本)来提高 Sphinx 的识别能力?我想要输出的是短语中每个单词的准确开始/停止时间。

(我知道你可以传递-time yes给 pocketsphinx 来获取我正在寻找的时间数据——但是,语音识别本身并不是很准确。)

解决方案不能针对特定的演讲者,因为我正在使用的语料库包含许多不同的演讲者,尽管他们都使用美国英语。

0 投票
2 回答
1229 浏览

cmusphinx - 运行 pocketsphinx_continuous 时出错:未指定声学模型定义

当我运行时pocketsphinx_continuous -inmic yes,我得到这个错误:ERROR: "acmod.c", line 85: Acoustic model definition is not specified neither with -mdef option nor with -hmm

我已经阅读了这个 StackOverflow 问题以及Pocketsphinx FAQ中的信息,但这些都没有帮助。

这是完整的堆栈跟踪:

我正在使用pocketsphinx-ruby gem构建一个应用程序。我已经在 OS X 上成功安装了它,但现在我正试图将它安装在我的运行 Linux Mint 17 的家用计算机上。我最初是从源代码编译它,但最终遇到了无法识别我的音频库的问题,所以我选择了 Synaptic 包管理器中的版本。

我已经安装了 libpulse-dev 和 libasound2 软件包。

那么,想法?我应该如何解决这个问题?我缺少任何包裹吗?我应该从源头再试一次吗?

0 投票
1 回答
3941 浏览

python - 在 Windows 7 上设置 CMUSphinx/PocketSphinx

我已经尝试了几个小时,但似乎无法做到这一点。我正在尝试下载 Pocketsphinx 以在 Python 中使用命令识别。

所以我做的第一件事是尝试安装SphinxBase,这是Pocketsphinx工作所必需的。所以我们开始吧。我下载了文件,tar.gz zip。我按照 README 文档中的说明在 Windows 上安装。

我以前从未使用过视觉,但它似乎很容易解释。我做的第一件事是解压缩并重命名。接下来,我以可视方式打开了 SLN 项目,选择了所有 6 个项目,即 Files>Build Selection。它在所有 6 个项目成功的情况下构建。太好了,搞定了。这真的是全部吗?我必须做?

接下来是PocketSphinx。我再次下载了 tar.gz,基本上做了同样的过程。

所有构建都成功构建。所以……完成了,对吧?在这之后,我迷路了。大多数教程到此为止,实际上并没有涉及在其他语言中使用 Pocketsphinx。我需要能够在 Python 中使用它。

所以我做了一些挖掘,在 pocketsphinx/python 下找到了一个 setup_win32.py 文件。我试图在命令提示符下运行它,但出现多个错误。现在我正在运行 Windows 64 位,但这会导致这个问题吗? http://hastebin.com/japobecusi.tex

所以总而言之,我只需要帮助让它与 Python 一起工作。我目前对这些事情非常缺乏经验。谢谢

还有一件事,我正在考虑切换到我的 Ubuntu Linux 分区,以便让我自己更轻松。大多数程序,包括这个程序,似乎只使用 windows 32,像 64 显然是不可接受的。那么转移到 Linux 平台以使用 Python 工作对我有好处吗?会更容易吗?

感谢您提前提供任何帮助。

0 投票
1 回答
384 浏览

python - 在 mac osx 上带有 gstreamer 的 Pocketsphinx。AudioUnitRender 返回 -10863

安装后我试图从pocketsphinx源运行liveemo.py并偶然发现pocketsphinx问题。缩小范围,问题出在pocketsphinx gsteamer插件上。

简单地运行这个:

产生这个调试输出(GST_DEBUG=*:2):

...

...

没有任何东西可以通过pocketsphinx,当然也没有语音识别。相比之下,这条线输出的录音没有问题:

设置:我用 Homebrew 和 Macports 在 OS X Lion 和 Yosemite 上进行了尝试。这是我在使用 macports 时所做的:

构建和安装 sphinxbase 和 pocketsphinx

0 投票
1 回答
5669 浏览

python - 我们如何使用 pocketsphinx 将 .wav 文件转换为文本?

我在我的Linux机器上正确安装了pocketsphinx,现在我想使用pocketsphinx将音频文件(.wave)转换为文本,我该怎么做?有没有明确的命令和简短的命令来做到这一点?像这样的命令:

还有我怎么能用python做到这一点?提前致谢。