问题标签 [pocketsphinx]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
2065 浏览

python - 在 Windows 7 上使用 pip 安装 Pocketsphinx

我正在尝试在 Windows 7 上为 Python 2.7 安装 pocketsphinx。我找到了这个https://github.com/bambocher/pocketsphinx-python,安装了依赖项,运行了 pip install pocketsphinx,这导致了“成功安装 pocketsphinx-0.0.5”的消息,但是当我尝试运行 python 文件时包含 import pocketsphinx 我收到一个导入错误,“没有名为 pocketsphinx 的模块。” 知道问题可能是什么吗?

0 投票
1 回答
256 浏览

unicode - Pocketsphinx 的僧伽罗语模型问题

我正在尝试为僧伽罗语创建语音识别系统。我尝试创建一个语言模型,但遵循Build NEW Acoustic model, Dictionary , Language model for uncommon language speech recognition中的答案。我在 windows 上同时使用了在线 lmtool 和 cmuclmtk-0.7-win32。我的输入文件如下,

提交到 lmtool 和 cmuclmtk 后,我得到如下输出,

.dic 和 .lm 文件都包含上述字符。我觉得这些都是一些垃圾字符。我做错了什么得到这个?

0 投票
1 回答
888 浏览

ubuntu - Pocketsphinx 声学模型使用 sphinx_fe 命令创建问题

现在我在构建声学模型时遇到了一些麻烦,我在虚拟盒子上使用 ubuntu 14.04 来测试运行 pocketsphinx 并使用 sphinxtrain 训练我的声学模型。我是否需要先将我的 .wav 文件转换为 .mfc 然后运行“sphinxtrain run”命令?我做了以下步骤,

  1. 运行“ sphinxtrain run ”命令
  2. 运行sphinx_fe -i Anuradha-eight.wav -o file.mfc -argfile etc/feat.params以将 .wav 转换为 .mfc

两次尝试都失败了。输出和日志文件可以在这里看到

0 投票
1 回答
637 浏览

visual-studio-2013 - 在 Visual Studio 2013 中加载 CMU sphinx 时出错

我正在尝试在 Visual Studio 2013 中加载 CMU sphinx,但出现了一些错误。我遵循的步骤是

我下载了 sphinxbase-5pr​​ealpha 和 pocketsphinx-5prealpha 并提取到同一个文件夹。

然后我在visual studio中编译了pocketsphinx和sphinxbase的所有项目(它要求我升级编译器,所以我做了升级)

现在清理项目后,当我尝试构建所有项目时,它会抛出一个错误,即“无法打开 sphinxbase.lib”,它显示在 pocketsphinx 项目中。

当我检查项目的链接器中已经存在“sphinxbase.lib”文件时。

在此处输入图像描述

根据文档,“sphinxbase.dll”文件应该添加到 bin 文件中,但它已经添加到目录 bot 发布和调试中。

在此处输入图像描述

同样,它也存在于调试目录中。

请帮助我,谁能告诉我我在这里做错了什么?

我只是这方面的初学者。

谢谢 !

0 投票
1 回答
249 浏览

python - Pocketsphinx Raspberry Pi 读取 dmp 文件时出错

我正在尝试在Raspberry Pi 2 B上使用pocketsphinx和python。

但是当我创建解码器并尝试读取 dmp 文件时,它会抛出:

然后程序结束,我也尝试了手机模型,它完美地工作!(但识别度差)。

你知道可能是什么问题吗?

0 投票
2 回答
2720 浏览

cmusphinx - Pocketsphinx:将 -inmic yes 的实时输出捕获到 .txt

我在 Windows 上使用 pocketsphinx_continuous。使用“-infile”参数将输出重定向到文本文件,但使用“-inmic yes”失败。

如问题中所述,Pocketsphinx 是否刷新标准输出?pocketsphinx 忽略标准输出(至少在使用 -inmic 时)。

有什么方法可以将带有“-inmic yes”的pocketsphinx_continuous识别的单词保存到文本文件中?

具体来说,我希望我的 Java 程序运行 pocketsphinx_continuous.exe 并从麦克风输入中识别出单词。

解决方案

按照 Alexander Solovets 的建议使用-backtracewith-logfn确实将结果与指定文件中的日志一起保存。但是,日志的保存频率不如结果发送到终端的频率高。我希望尽快将结果输出到文件中,因此我从源代码构建了 pocketsphinx_continuous.exe,并对continous.c.

在连续.c 中:

0 投票
0 回答
818 浏览

java - 在我自己的 Android 应用程序中设置 PocketSphinx 库

我正在尝试Pocket Sphinx Library.

我的方法是,

我刚刚下载了他们的 Android 演示项目。在 Eclipse 中导入它,进行干净构建并在设备上运行它。它运行成功。

在此之后,我将libs文件夹从演示项目复制到我自己的项目中。我复制了我自己项目中assets文件夹内容。然后我根据这篇文章编辑了文件内容。digits.gram

然后Listener在我的活动中实现并添加addKeywordSearch到它。

我的问题:

  1. 这种方法在我们自己的项目中实现这个库是否正确?我们可以复制粘贴所有文件,.gram根据需要修改文件并运行它吗?还是我们需要做一些其他的步骤来生成.gram文件?

  2. 当我尝试使用上述方法时,项目在设备上成功运行了几次。但在那之后它开始显示以下错误。

    /li>

但是/1e-20/存在于我的digits.gram文件中。

digits.gram文件内容:

  1. 我注意到一件事,当我对 Pocket Sphinx 的演示项目进行干净构建并运行它时,它会重新创建digits.gram.md5文件。但是当我将所有内容复制粘贴到我自己的项目中并进行 cleant-build 时,这些文件并没有重新创建。这是正常的吗?

  2. 我们项目中的所有文件是否需要像演示项目中一样?或者我可以从我自己的项目中删除一些未使用的文件吗?任何必要文件的列表(在资产文件夹或库或其他文件中)都将非常有帮助。

请让我知道我应该用什么方法在我自己的项目中成功实施它。

我的活动代码

我的项目结构如下

在此处输入图像描述

0 投票
1 回答
86 浏览

voice-recognition - 使用 SRILM 为僧伽罗语创建语言模型的问题

我正在尝试使用pocketsphinx 创建一个僧伽罗语语音识别系统。我使用 SRILM 工具来创建语言模型。我创建语言模型的源文件在这里。我在 Windows 8.1 上使用 cygwin 来运行 SRILM 1.7.1。但是一旦我运行命令

我越来越

我在这里做错了什么?sinhalacorpus.Train 文件是使用 Notepad++ 手动创建的

0 投票
1 回答
141 浏览

speech-recognition - Sphinxtrain senone.c 错误和 pocketsphinx_continuous bin_mdef.c 错误

当我使用 pocketsphinx 构建僧伽罗语语音识别系统时,我在运行sphinxtrain run命令和 pocketsphinx_continuous命令时遇到了两个主要错误,我的项目文件夹可以在这里看到。我仍在使用小型数据集,目前我正在记录更多单词。运行 sphinxtrain run 命令后,我通过创建文件夹调用si将以下文件复制到 pocketsphinx 语言模型默认位置/usr/local/share/pocketsphinx/model/en-us/

  • 定义
  • 壮举参数
  • 混合权重
  • 方法
  • 噪音字典
  • 转换矩阵
  • 差异
  • 僧伽罗语
  • 僧伽罗语.lm
  • 僧伽罗话

然后我运行了pocketsphinx_continuous命令,我得到的错误是HERE

  1. 对于僧伽罗语将电话数量特别减少到255以下非常困难。他们有什么解决方案吗?
  2. 为什么我收到日志中提到的 senone.c 错误?以及如何纠正?
  3. SRILM 是否支持为僧伽罗语创建 .lm.bin 文件?
0 投票
1 回答
1053 浏览

speech-recognition - pocketsphinx 如何在定位模式下输出关键字

我进入 shellpocketsphinx_continuous -infile talk.wav -keyphrase "talk" -kws_threshold 1e-40并收到了由袖珍狮身人面像生成的大量输出,最后有一些数字。你怎么知道它是否发现了一个单词?输出的最后两行: