问题标签 [cmusphinx]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
dictionary - 如何将简单的单词转换为 Sphinx4 WSJ,如 Dictionary Prounounciation?
我刚刚完成了这个 Sphinx4 语音识别,我已经用 sphinx4 的 helloworld 演示实现了它,现在想要的是创建一个动态字典对于作为输入给出的文本文件,现在我需要做的就是创建一个文本文件并在 IMTOOLS 中上传,然后他们为我提供了一个 .Dict 文件。
但是我的要求就像用户在文本框中键入任何文本并单击转换按钮,然后它会自动将该单词转换为 WSJ Dcitionary,例如发音单词,\ EG 用户在文本框中键入他想要识别的单词让我们说它是“ ANKIT" 然后它会自动将该单词转换为 wsj 字典格式,如 "AE NG K AH T" 。请任何人都可以帮助我吗?或有任何建议吗?我想这样做...希望我以良好的方式解释,您可以以适当的方式理解并给我答复..”
如果有人通过付款提供此服务。那么即使它还可以...
java - Eclipse 的 Sphinx4 Beta API 问题
我正在尝试使用 Sphinx 4.0 设置一个简单的 helloworld 演示(这显然是一个测试版?)我下载了源并将其作为源添加到 Eclipse,但问题是,它不能识别很多类。我一直在寻找,据我所知,它想要的课程不存在!例如,该行:
引发编译器错误,说明无法解析导入。这是我在尝试做 Sphinx4 之前应该下载的更大 API 的一部分吗?它没有说明任何其他 API,但我对这种可能性持开放态度。
如果您愿意,我可以发布所有无法解决的导入列表,我会的,但这意味着查看所有代码,这有点痛苦。我有一种预感,我需要下载 JSAPI,但我不知道哪种实现对 Sphinx4 有好处。
Sphinx4 下载链接:
http://sourceforge.net/projects/cmusphinx/files/sphinx4/1.0%20beta6/
http://cmusphinx.sourceforge.net/
编辑:此外,我发现有几行我认为可能意味着我需要下载 JUnit?同样,我不完全确定如何设置它。
speech-recognition - Sphinx4 音素分割
我正在开发一个系统,我需要单词或句子中每个音素的起始帧、结束帧和分割分数。我一直在使用 Sphinx-3 命令:sphinx3_align,以获得以下结果(示例):
问题是,我必须多次运行此命令,这在我的服务器中消耗了大量内存。我尝试在控制文件中传递许多输入,但这需要很长时间来处理,而且我的应用程序不能有很长的响应时间。
因此,为了消耗更少的内存来维持响应时间,我试图在 Sphinx-4 中实现相同的系统。这样我就可以在对齐后立即返回结果,而不必在每次运行时卸载应用程序。
我的疑问是是否可以在 Sphinx-4 中显示上述输出(类似于 sphinx3_align)?
windows - Windows 7 中的 Sphinxtrain 快照
我已经在 Windows 7 计算机上下载了 sphinxbase.tar.gz 和 sphinxtrain.tar.gz。使用 Visual Studio 2010 构建。我已经安装了 Activeperl,python 3.3。
在教程http://cmusphinx.sourceforge.net/wiki/tutorialam它说:
对于 sphinxtrain 快照
它可能适用于linux系统。如何在 Windows 7(64 位)中运行 sphinxtrain(快照)?
java - 将 wav 转换为倒谱导致 Shpinx 4 关键字定位功能精度低
我正在尝试构建一个关键字定位系统,我选择这个sphinx 4 的一个分支作为我项目的基础。
它适用于 wav 文件(至少 70% 使用单个关键字)。但是为了节省将文件从客户端传输到服务器的时间,我决定先在客户端将 wav 文件转换为倒谱,然后再传输倒谱。这项工作由Featurefiledumper执行。
但是当将倒谱加载到原来的 KWS 系统中时,精度是可怕的。我以为我只是在客户中放了一些作品,它应该不会对准确性产生太大影响。原来的 KWS 系统可以将每个单词分成适当的块然后识别。使用频谱作为输入后,系统甚至无法正确拆分每个单词。我想这也是它不能达到高精度的原因。
我想找到一种方法来节省传输文件的时间,并且仍然具有 KWS 系统的合理准确性。我在配置中有什么遗漏或者有其他方法可以满足需求吗?
这是客户端的配置:
这是服务器端的配置:
==================================================== =================
感谢尼古拉。我发现原因是处理文件的组件不同(StreamDataSource 和 AudioFileDataSource)。
但是有个问题,我的客户端是安卓系统。它不支持 javax.sound.sampled 类。所以在我的客户端上使用 AudioFileDataSource 是不可能的。StreamDataSource 是一种可能的解决方案。但我不知道为什么这两个组件会导致不同的功能集。
是否有提示使 StreamDataSource 生成与 AudioFileDataSource 相同的结果?
python - 在 Mac OS X 中设置 PocketSphinx
我正在运行Enthought Python 2.7
以及默认Python 2.7
,Xcode 4.5.1
在Mac OS 10.8.2
. 我正在尝试在Python
. 我使用Enthought Python
它,因为它允许我记录16000Hz, 1 Channel
使用pyaudio
,这是工作所必需的pocketsphinx
。
我正在尝试pocketsphinx
使用brew install pocketsphinx
.
我收到以下错误
make
即使使用和使用默认值进行手动安装也会python
导致相同的错误
使用 brew doctor ,我得到
如何成功安装pocketsphinx
?
这是我的config.log
ruby-on-rails - 如何在 Ruby 应用程序中使用 CMU Sphinx 语音识别?
我正在寻找如何将 CMU Sphinx 与 Ruby (Rails) 应用程序一起使用。我需要非常简单的任务 - 我有一个 mp3 文件,我想把它转录成文本。
我怎样才能实现这个最简单的方法?我不知道 C/C++,而且我的任务并不是为它学习 C/C++ :)
感谢帮助!
java - 将 jar 文件包含到类路径中
我试图运行 Sphinx 的 HelloWOrd 程序,它需要一个 .jar 文件才能工作。
我试图在类路径中添加一个 jar 文件,但我遇到了一些错误
竞争.util 不存在导入 edu.cmu.sphinx.frontend.util.Microphone;^ home/karen/workspace/hola/src/hola/HelloWorld.java:4: 包 edu.cmu.sphinx.recognizer 不存在导入 edu.cmu.sphinx.recognizer.Recognizer; ^ home/karen/workspace/hola/src/hola/HelloWorld.java:5: 包 edu.cmu.sphinx.result 不存在 import edu.cmu.sphinx.result.Result; ^ home/karen/workspace/hola/src/hola/HelloWorld.java:6: 包 edu.cmu.sphinx.util.props 不存在导入 edu.cmu.sphinx.util.props.ConfigurationManager;^ home/karen/workspace/hola/src/hola/HelloWorld.java:11:找不到符号符号:类 ConfigurationManager 位置:类 hola。HelloWorld 配置管理器厘米;^ home/karen/workspace/hola/src/hola/HelloWorld.java:14:找不到符号符号:类 ConfigurationManager 位置:类 hola.HelloWorld cm = new ConfigurationManager(args[0]); ^ home/karen/workspace/hola/src/hola/HelloWorld.java:16:找不到符号符号:类 ConfigurationManager 位置:类 hola.HelloWorld cm = new ConfigurationManager(HelloWorld.class.getResource("helloworld.config.xml" )); ^ home/karen/workspace/hola/src/hola/HelloWorld.java:19:找不到符号符号:类识别器位置:类hola.HelloWorld识别器识别器=(识别器)cm.lookup(“识别器”);^ home/karen/workspace/hola/src/hola/HelloWorld.java:19:找不到符号符号:类识别器位置:类hola.HelloWorld识别器识别器=(识别器)cm.lookup(“识别器”);^ home/karen/workspace/hola/src/hola/HelloWorld.java:23:找不到符号符号:类麦克风位置:类hola.HelloWorld麦克风麦克风=(麦克风)cm.lookup(“麦克风”);^ home/karen/workspace/hola/src/hola/HelloWorld.java:23:找不到符号符号:类麦克风位置:类hola.HelloWorld麦克风麦克风=(麦克风)cm.lookup(“麦克风”);^ 家/卡伦/工作区/hola/src/hola/HelloWorld。java:36:找不到符号符号:类结果位置:类hola.HelloWorld结果结果=recogner.recognize();^ 12 个错误
我的问题是:我必须添加所有需要我的项目的包还是只添加 jar 文件和主类?
请建议!
这是 HelloWord 程序:
包好啦;
}
open-source - 在 Linux Mint 13 上编译 CMU PocketSphynx
我已经在 Linux Mint 13(基于 Ubuntu 12.04 LTS)上安装了 CMU Sphynx,但我根本找不到任何示例:
如何以最简单的方式测试它是如何工作的?我想从命令行启动它并识别任何 .wav 文件。我读过文档,但只有 c++ 或 python 示例,没有 pocketsphynx_continious 示例
我在哪里可以在 Mint 获得 /dev/dsp 设计?我已经为 alsa 和 pulseaudio 安装了所有开发库 - 根本没有 /dev/dsp。
有什么帮助吗?
java - 运行 Pythontranscriber.py 时出错
当我尝试运行 pythontranscriber.py 时,它失败并出现以下错误:
我的脚本 PythonTranscriber.py:
我已经安装了 Jython!
请帮我!