问题标签 [cmusphinx]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
801 浏览

dictionary - 如何将简单的单词转换为 Sphinx4 WSJ,如 Dictionary Prounounciation?

我刚刚完成了这个 Sphinx4 语音识别,我已经用 sphinx4 的 helloworld 演示实现了它,现在想要的是创建一个动态字典对于作为输入给出的文本文件,现在我需要做的就是创建一个文本文件并在 IMTOOLS 中上传,然后他们为我提供了一个 .Dict 文件。

但是我的要求就像用户在文本框中键入任何文本并单击转换按钮,然后它会自动将该单词转换为 WSJ Dcitionary,例如发音单词,\ EG 用户在文本框中键入他想要识别的单词让我们说它是“ ANKIT" 然后它会自动将该单词转换为 wsj 字典格式,如 "AE NG K AH T" 。请任何人都可以帮助我吗?或有任何建议吗?我想这样做...希望我以良好的方式解释,您可以以适当的方式理解并给我答复..”

如果有人通过付款提供此服务。那么即使它还可以...

0 投票
1 回答
210 浏览

java - Eclipse 的 Sphinx4 Beta API 问题

我正在尝试使用 Sphinx 4.0 设置一个简单的 helloworld 演示(这显然是一个测试版?)我下载了源并将其作为源添加到 Eclipse,但问题是,它不能识别很多类。我一直在寻找,据我所知,它想要的课程不存在!例如,该行:

引发编译器错误,说明无法解析导入。这是我在尝试做 Sphinx4 之前应该下载的更大 API 的一部分吗?它没有说明任何其他 API,但我对这种可能性持开放态度。

如果您愿意,我可以发布所有无法解决的导入列表,我会的,但这意味着查看所有代码,这有点痛苦。我有一种预感,我需要下载 JSAPI,但我不知道哪种实现对 Sphinx4 有好处。

Sphinx4 下载链接:

http://sourceforge.net/projects/cmusphinx/files/sphinx4/1.0%20beta6/

http://cmusphinx.sourceforge.net/

编辑:此外,我发现有几行我认为可能意味着我需要下载 JUnit?同样,我不完全确定如何设置它。

0 投票
1 回答
630 浏览

speech-recognition - Sphinx4 音素分割

我正在开发一个系统,我需要单词或句子中每个音素的起始帧结束帧分割分数。我一直在使用 Sphinx-3 命令:sphinx3_align,以获得以下结果(示例):

问题是,我必须多次运行此命令,这在我的服务器中消耗了大量内存。我尝试在控制文件中传递许多输入,但这需要很长时间来处理,而且我的应用程序不能有很长的响应时间。

因此,为了消耗更少的内存来维持响应时间,我试图在 Sphinx-4 中实现相同的系统。这样我就可以在对齐后立即返回结果,而不必在每次运行时卸载应用程序。

我的疑问是是否可以在 Sphinx-4 中显示上述输出(类似于 sphinx3_align)?

0 投票
1 回答
709 浏览

windows - Windows 7 中的 Sphinxtrain 快照

我已经在 Windows 7 计算机上下载了 sphinxbase.tar.gz 和 sphinxtrain.tar.gz。使用 Visual Studio 2010 构建。我已经安装了 Activeperl,python 3.3。

在教程http://cmusphinx.sourceforge.net/wiki/tutorialam它说:

对于 sphinxtrain 快照

它可能适用于linux系统。如何在 Windows 7(64 位)中运行 sphinxtrain(快照)?

0 投票
1 回答
963 浏览

java - 将 wav 转换为倒谱导致 Shpinx 4 关键字定位功能精度低

我正在尝试构建一个关键字定位系统,我选择这个sphinx 4 的一个分支作为我项目的基础。

它适用于 wav 文件(至少 70% 使用单个关键字)。但是为了节省将文件从客户端传输到服务器的时间,我决定先在客户端将 wav 文件转换为倒谱,然后再传输倒谱。这项工作由Featurefiledumper执行。

但是当将倒谱加载到原来的 KWS 系统中时,精度是可怕的。我以为我只是在客户中放了一些作品,它应该不会对准确性产生太大影响。原来的 KWS 系统可以将每个单词分成适当的块然后识别。使用频谱作为输入后,系统甚至无法正确拆分每个单词。我想这也是它不能达到高精度的原因。

我想找到一种方法来节省传输文件的时间,并且仍然具有 KWS 系统的合理准确性。我在配置中有什么遗漏或者有其他方法可以满足需求吗?

这是客户端的配置:

这是服务器端的配置:

==================================================== =================

感谢尼古拉。我发现原因是处理文件的组件不同(StreamDataSource 和 AudioFileDataSource)。

但是有个问题,我的客户端是安卓系统。它不支持 javax.sound.sampled 类。所以在我的客户端上使用 AudioFileDataSource 是不可能的。StreamDataSource 是一种可能的解决方案。但我不知道为什么这两个组件会导致不同的功能集。

是否有提示使 StreamDataSource 生成与 AudioFileDataSource 相同的结果?

0 投票
1 回答
3775 浏览

python - 在 Mac OS X 中设置 PocketSphinx

我正在运行Enthought Python 2.7以及默认Python 2.7Xcode 4.5.1Mac OS 10.8.2. 我正在尝试在Python. 我使用Enthought Python它,因为它允许我记录16000Hz, 1 Channel使用pyaudio,这是工作所必需的pocketsphinx

我正在尝试pocketsphinx使用brew install pocketsphinx.

我收到以下错误在此处输入图像描述

make即使使用和使用默认值进行手动安装也会python导致相同的错误 在此处输入图像描述

使用 brew doctor ,我得到在此处输入图像描述

如何成功安装pocketsphinx

这是我的config.log

自制日志pocketsphinxsphinxbase

Bash_Profile

0 投票
3 回答
3787 浏览

ruby-on-rails - 如何在 Ruby 应用程序中使用 CMU Sphinx 语音识别?

我正在寻找如何将 CMU Sphinx 与 Ruby (Rails) 应用程序一起使用。我需要非常简单的任务 - 我有一个 mp3 文件,我想把它转录成文本。

我怎样才能实现这个最简单的方法?我不知道 C/C++,而且我的任务并不是为它学习 C/C++ :)

感谢帮助!

0 投票
1 回答
1066 浏览

java - 将 jar 文件包含到类路径中

我试图运行 Sphinx 的 HelloWOrd 程序,它需要一个 .jar 文件才能工作。

我试图在类路径中添加一个 jar 文件,但我遇到了一些错误

竞争.util 不存在导入 edu.cmu.sphinx.frontend.util.Microphone;^ home/karen/workspace/hola/src/hola/HelloWorld.java:4: 包 edu.cmu.sphinx.recognizer 不存在导入 edu.cmu.sphinx.recognizer.Recognizer; ^ home/karen/workspace/hola/src/hola/HelloWorld.java:5: 包 edu.cmu.sphinx.result 不存在 import edu.cmu.sphinx.result.Result; ^ home/karen/workspace/hola/src/hola/HelloWorld.java:6: 包 edu.cmu.sphinx.util.props 不存在导入 edu.cmu.sphinx.util.props.ConfigurationManager;^ home/karen/workspace/hola/src/hola/HelloWorld.java:11:找不到符号符号:类 ConfigurationManager 位置:类 hola。HelloWorld 配置管理器厘米;^ home/karen/workspace/hola/src/hola/HelloWorld.java:14:找不到符号符号:类 ConfigurationManager 位置:类 hola.HelloWorld cm = new ConfigurationManager(args[0]); ^ home/karen/workspace/hola/src/hola/HelloWorld.java:16:找不到符号符号:类 ConfigurationManager 位置:类 hola.HelloWorld cm = new ConfigurationManager(HelloWorld.class.getResource("helloworld.config.xml" )); ^ home/karen/workspace/hola/src/hola/HelloWorld.java:19:找不到符号符号:类识别器位置:类hola.HelloWorld识别器识别器=(识别器)cm.lookup(“识别器”);^ home/karen/workspace/hola/src/hola/HelloWorld.java:19:找不到符号符号:类识别器位置:类hola.HelloWorld识别器识别器=(识别器)cm.lookup(“识别器”);^ home/karen/workspace/hola/src/hola/HelloWorld.java:23:找不到符号符号:类麦克风位置:类hola.HelloWorld麦克风麦克风=(麦克风)cm.lookup(“麦克风”);^ home/karen/workspace/hola/src/hola/HelloWorld.java:23:找不到符号符号:类麦克风位置:类hola.HelloWorld麦克风麦克风=(麦克风)cm.lookup(“麦克风”);^ 家/卡伦/工作区/hola/src/hola/HelloWorld。java:36:找不到符号符号:类结果位置:类hola.HelloWorld结果结果=recogner.recognize();^ 12 个错误

我的问题是:我必须添加所有需要我的项目的包还是只添加 jar 文件和主类?

请建议!

这是 HelloWord 程序:

包好啦;

}

0 投票
1 回答
1044 浏览

open-source - 在 Linux Mint 13 上编译 CMU PocketSphynx

我已经在 Linux Mint 13(基于 Ubuntu 12.04 LTS)上安装了 CMU Sphynx,但我根本找不到任何示例:

  1. 如何以最简单的方式测试它是如何工作的?我想从命令行启动它并识别任何 .wav 文件。我读过文档,但只有 c++ 或 python 示例,没有 pocketsphynx_continious 示例

  2. 我在哪里可以在 Mint 获得 /dev/dsp 设计?我已经为 alsa 和 pulseaudio 安装了所有开发库 - 根本没有 /dev/dsp。

有什么帮助吗?

0 投票
1 回答
268 浏览

java - 运行 Pythontranscriber.py 时出错

当我尝试运行 pythontranscriber.py 时,它失败并出现以下错误:

我的脚本 PythonTranscriber.py:

我已经安装了 Jython!

请帮我!