“cmusphinx”的相关标签问题

0 投票

1 回答

801 浏览

dictionary - 如何将简单的单词转换为 Sphinx4 WSJ，如 Dictionary Prounounciation？

我刚刚完成了这个 Sphinx4 语音识别，我已经用 sphinx4 的 helloworld 演示实现了它，现在想要的是创建一个动态字典对于作为输入给出的文本文件，现在我需要做的就是创建一个文本文件并在 IMTOOLS 中上传，然后他们为我提供了一个 .Dict 文件。

但是我的要求就像用户在文本框中键入任何文本并单击转换按钮，然后它会自动将该单词转换为 WSJ Dcitionary，例如发音单词，\ EG 用户在文本框中键入他想要识别的单词让我们说它是“ ANKIT" 然后它会自动将该单词转换为 wsj 字典格式，如 "AE NG K AH T" 。请任何人都可以帮助我吗？或有任何建议吗？我想这样做...希望我以良好的方式解释，您可以以适当的方式理解并给我答复..”

如果有人通过付款提供此服务。那么即使它还可以...

2012-08-28T05:28:52.673

0 投票

1 回答

210 浏览

java - Eclipse 的 Sphinx4 Beta API 问题

我正在尝试使用 Sphinx 4.0 设置一个简单的 helloworld 演示（这显然是一个测试版？）我下载了源并将其作为源添加到 Eclipse，但问题是，它不能识别很多类。我一直在寻找，据我所知，它想要的课程不存在！例如，该行：

引发编译器错误，说明无法解析导入。这是我在尝试做 Sphinx4 之前应该下载的更大 API 的一部分吗？它没有说明任何其他 API，但我对这种可能性持开放态度。

如果您愿意，我可以发布所有无法解决的导入列表，我会的，但这意味着查看所有代码，这有点痛苦。我有一种预感，我需要下载 JSAPI，但我不知道哪种实现对 Sphinx4 有好处。

Sphinx4 下载链接：

http://sourceforge.net/projects/cmusphinx/files/sphinx4/1.0%20beta6/

http://cmusphinx.sourceforge.net/

编辑：此外，我发现有几行我认为可能意味着我需要下载 JUnit？同样，我不完全确定如何设置它。

java eclipse api beta cmusphinx

2012-08-29T01:47:10.563

0 投票

1 回答

630 浏览

speech-recognition - Sphinx4 音素分割

我正在开发一个系统，我需要单词或句子中每个音素的起始帧、结束帧和分割分数。我一直在使用 Sphinx-3 命令：sphinx3_align，以获得以下结果（示例）：

问题是，我必须多次运行此命令，这在我的服务器中消耗了大量内存。我尝试在控制文件中传递许多输入，但这需要很长时间来处理，而且我的应用程序不能有很长的响应时间。

因此，为了消耗更少的内存来维持响应时间，我试图在 Sphinx-4 中实现相同的系统。这样我就可以在对齐后立即返回结果，而不必在每次运行时卸载应用程序。

我的疑问是是否可以在 Sphinx-4 中显示上述输出（类似于 sphinx3_align）？

speech-recognition voice-recognition cmusphinx sphinx4

2012-10-22T17:22:14.433

0 投票

1 回答

709 浏览

windows - Windows 7 中的 Sphinxtrain 快照

我已经在 Windows 7 计算机上下载了 sphinxbase.tar.gz 和 sphinxtrain.tar.gz。使用 Visual Studio 2010 构建。我已经安装了 Activeperl，python 3.3。

在教程http://cmusphinx.sourceforge.net/wiki/tutorialam它说：

对于 sphinxtrain 快照

它可能适用于linux系统。如何在 Windows 7（64 位）中运行 sphinxtrain（快照）？

windows cmusphinx

2012-10-23T13:25:34.700

0 投票

1 回答

963 浏览

java - 将 wav 转换为倒谱导致 Shpinx 4 关键字定位功能精度低

我正在尝试构建一个关键字定位系统，我选择这个sphinx 4 的一个分支作为我项目的基础。

它适用于 wav 文件（至少 70% 使用单个关键字）。但是为了节省将文件从客户端传输到服务器的时间，我决定先在客户端将 wav 文件转换为倒谱，然后再传输倒谱。这项工作由Featurefiledumper执行。

但是当将倒谱加载到原来的 KWS 系统中时，精度是可怕的。我以为我只是在客户中放了一些作品，它应该不会对准确性产生太大影响。原来的 KWS 系统可以将每个单词分成适当的块然后识别。使用频谱作为输入后，系统甚至无法正确拆分每个单词。我想这也是它不能达到高精度的原因。

我想找到一种方法来节省传输文件的时间，并且仍然具有 KWS 系统的合理准确性。我在配置中有什么遗漏或者有其他方法可以满足需求吗？

这是客户端的配置：

这是服务器端的配置：

==================================================== =================

感谢尼古拉。我发现原因是处理文件的组件不同（StreamDataSource 和 AudioFileDataSource）。

但是有个问题，我的客户端是安卓系统。它不支持 javax.sound.sampled 类。所以在我的客户端上使用 AudioFileDataSource 是不可能的。StreamDataSource 是一种可能的解决方案。但我不知道为什么这两个组件会导致不同的功能集。

是否有提示使 StreamDataSource 生成与 AudioFileDataSource 相同的结果？

java speech-recognition cmusphinx

2012-10-30T11:47:08.120

0 投票

1 回答

3775 浏览

python - 在 Mac OS X 中设置 PocketSphinx

我正在运行Enthought Python 2.7以及默认Python 2.7，Xcode 4.5.1在Mac OS 10.8.2. 我正在尝试在Python. 我使用Enthought Python它，因为它允许我记录16000Hz, 1 Channel使用pyaudio，这是工作所必需的pocketsphinx。

我正在尝试pocketsphinx使用brew install pocketsphinx.

我收到以下错误在此处输入图像描述

make即使使用和使用默认值进行手动安装也会python导致相同的错误在此处输入图像描述

使用 brew doctor ，我得到在此处输入图像描述

如何成功安装pocketsphinx？

这是我的config.log

自制日志pocketsphinx，sphinxbase

Bash_Profile

python macos speech-to-text cmusphinx

2012-11-08T05:37:51.267

0 投票

3 回答

3787 浏览

ruby-on-rails - 如何在 Ruby 应用程序中使用 CMU Sphinx 语音识别？

我正在寻找如何将 CMU Sphinx 与 Ruby (Rails) 应用程序一起使用。我需要非常简单的任务 - 我有一个 mp3 文件，我想把它转录成文本。

我怎样才能实现这个最简单的方法？我不知道 C/C++，而且我的任务并不是为它学习 C/C++ :)

感谢帮助！

ruby-on-rails ruby cmusphinx

2012-11-08T17:18:51.233

0 投票

1 回答

1066 浏览

java - 将 jar 文件包含到类路径中

我试图运行 Sphinx 的 HelloWOrd 程序，它需要一个 .jar 文件才能工作。

我试图在类路径中添加一个 jar 文件，但我遇到了一些错误

竞争.util 不存在导入 edu.cmu.sphinx.frontend.util.Microphone；^ home/karen/workspace/hola/src/hola/HelloWorld.java:4: 包 edu.cmu.sphinx.recognizer 不存在导入 edu.cmu.sphinx.recognizer.Recognizer; ^ home/karen/workspace/hola/src/hola/HelloWorld.java:5: 包 edu.cmu.sphinx.result 不存在 import edu.cmu.sphinx.result.Result; ^ home/karen/workspace/hola/src/hola/HelloWorld.java:6: 包 edu.cmu.sphinx.util.props 不存在导入 edu.cmu.sphinx.util.props.ConfigurationManager；^ home/karen/workspace/hola/src/hola/HelloWorld.java:11：找不到符号符号：类 ConfigurationManager 位置：类 hola。HelloWorld 配置管理器厘米；^ home/karen/workspace/hola/src/hola/HelloWorld.java:14：找不到符号符号：类 ConfigurationManager 位置：类 hola.HelloWorld cm = new ConfigurationManager(args[0]); ^ home/karen/workspace/hola/src/hola/HelloWorld.java:16：找不到符号符号：类 ConfigurationManager 位置：类 hola.HelloWorld cm = new ConfigurationManager(HelloWorld.class.getResource("helloworld.config.xml" )); ^ home/karen/workspace/hola/src/hola/HelloWorld.java:19：找不到符号符号：类识别器位置：类hola.HelloWorld识别器识别器=（识别器）cm.lookup（“识别器”）；^ home/karen/workspace/hola/src/hola/HelloWorld.java:19：找不到符号符号：类识别器位置：类hola.HelloWorld识别器识别器=（识别器）cm.lookup（“识别器”）；^ home/karen/workspace/hola/src/hola/HelloWorld.java:23：找不到符号符号：类麦克风位置：类hola.HelloWorld麦克风麦克风=（麦克风）cm.lookup（“麦克风”）；^ home/karen/workspace/hola/src/hola/HelloWorld.java:23：找不到符号符号：类麦克风位置：类hola.HelloWorld麦克风麦克风=（麦克风）cm.lookup（“麦克风”）；^ 家/卡伦/工作区/hola/src/hola/HelloWorld。java：36：找不到符号符号：类结果位置：类hola.HelloWorld结果结果=recogner.recognize（）；^ 12 个错误

我的问题是：我必须添加所有需要我的项目的包还是只添加 jar 文件和主类？

请建议！

这是 HelloWord 程序：

包好啦；

}

java classpath voice-recognition cmusphinx

2012-11-11T00:47:44.260

0 投票

1 回答

1044 浏览

open-source - 在 Linux Mint 13 上编译 CMU PocketSphynx

我已经在 Linux Mint 13（基于 Ubuntu 12.04 LTS）上安装了 CMU Sphynx，但我根本找不到任何示例：

如何以最简单的方式测试它是如何工作的？我想从命令行启动它并识别任何 .wav 文件。我读过文档，但只有 c++ 或 python 示例，没有 pocketsphynx_continious 示例
我在哪里可以在 Mint 获得 /dev/dsp 设计？我已经为 alsa 和 pulseaudio 安装了所有开发库 - 根本没有 /dev/dsp。

有什么帮助吗？

open-source voice-recognition cmusphinx linux-mint

2012-11-12T19:29:57.663

0 投票

1 回答

268 浏览

java - 运行 Pythontranscriber.py 时出错

当我尝试运行 pythontranscriber.py 时，它失败并出现以下错误：

我的脚本 PythonTranscriber.py：

我已经安装了 Jython！

请帮我！

java jython voice-recognition importerror cmusphinx

2012-11-13T01:47:23.897

问题标签 [cmusphinx]

Reference