问题标签 [cmusphinx]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
2151 浏览

speech-recognition - 使用 CMU Shinx、JSAPI 和 Google Speech API 进行语音识别

语音识别是我当前项目的众多功能之一,最有可能在 J2EE 中开发(如果选择合理,也欢迎其他语言)。

googleSO上的大多数链接都建议上述三个选项,Sphinx 4、JSAPI 直接和 Google Speech API(对 google 进行服务器调用,而不是以文本形式获取结果)。

我还有哪些其他免费可用的选项?如果我使用 Sphinx-4,如何获得通用英语的语言模型?

0 投票
1 回答
27557 浏览

java - 如何使用 CMU Sphinx 4 使用英语 voxforge 模型进行语音到文本

我试图弄清楚如何将 sphinx4 或 pocketsphinx 与英语 voxforge 模型一起使用,但我无法让它工作。我曾尝试阅读文档页面(例如这个http://cmusphinx.sourceforge.net/sphinx4/doc/UsingSphinxTrainModels.html),但它对我没有帮助。

我想要的是一个可执行文件,我可以在其中指定要使用的模型以及要用作源的音频文件,并让可执行文件打印出来,这是对录音中声音的最佳猜测。

我有一些运气:pocketsphinx_continuous -infile recording.wav 2> /dev/null

但它在完整的音频文件被转录之前就中止了,并且默认模型只有很少的单词才能从音频中创建可读的文本。

我已经编译并测试了 sphinx4 源代码包中的演示,但所有示例似乎都只有几句话,需要一个模型 loke voxforge 对我有用。

我该如何设置?

0 投票
1 回答
6162 浏览

speech-recognition - 使用 Sphinx4 的听写应用程序

我的要求与这个问题类似,因为这个问题现在已经 3 年了它发短信。

对于语音识别,我决定使用 sphinx4,我正在尝试增强 sphinx 提供的转录器演示。它很好,但这仅适用于特定的语法(用 .gram 和 .gxml 文件编写)。

编辑 为了能够与英语一起使用?我正在尝试使用 VoxForge_en_0.4 对其进行配置。我的 config.XML 文件如下所示:-

他们对我的配置有什么问题吗?请帮忙....

0 投票
2 回答
2343 浏览

c - 如何在应用程序中使用 Sphinx3

我使用 Sphinx4 有一段时间了,它确实符合我的需求。我加载一个识别器,将音频数据传递给它,并在我的应用程序中使用识别的字符串。

现在我正在开发一个 C 应用程序(不幸的是 C++ 不是一个选项),我需要类似的东西,并认为我可以使用用 C 编写的 Sphinx3。

问题是我真的不知道它是如何在应用程序中使用的,并且没有 Sphinx4 提供的“Hello World”示例。

我已经编译并安装了 sphinxbase 和 sphinx3,现在我可以在我的应用程序中包含 sphinx 头文件。

现在我的问题:

  • 是否有使用来自 C 环境的 sphinx3 的“简单”且有据可查的示例应用程序?
  • 如何加载 sphinx3 引擎并使用我的二进制音频数据调用识别器?
  • 或者:我是否需要启动像“sphinx3_decode”这样的应用程序并从我自己的应用程序中调用它?如果是这样,是否有一个示例应用程序?

先感谢您!

最好的问候,罗伯特

0 投票
1 回答
1325 浏览

mp3 - 使用 Sphinx 4 进行 mp3 识别

我们可以在不使用 wav 文件的情况下使用 mp3 文件进行语音识别过程吗?或者我们可以从 mp3 生成一个 wav 文件,然后在不严重影响准确性的情况下进行语音识别?问题是我需要在我的应用程序中最小化通过网络传输的负载。转换中丢失的信息是否会成为影响准确性的重要因素?

0 投票
1 回答
1291 浏览

php - 我可以在基于 php 的电子购物 CMS 中使用 CMU Sphinx 吗?

我想在基于 CMS 的电子购物系统中集成用于搜索的语音识别系统。这个 CMS 是用 PHP 制作的。那么 CMU Sphinx 是否支持 PHP 集成?或者还有其他方法可以完成任务吗?

0 投票
1 回答
627 浏览

cmusphinx - 无法运行 CMUSphinx 程序

我已经使用这个博客(这里)安装了 CMUSphinx。我正确地完成了所有步骤。但是当我执行同一个博客中提供的示例程序时(这个程序)。它向我显示以下错误

--------- 错误: ---------- 无法创建 vader。初始化失败...

我不知道该怎么办。我正在使用 Ubuntu 11.10/64 位。有没有我没有安装的包?

0 投票
1 回答
1199 浏览

python - python pocketsphinx中的单词时间戳

我在 ubuntu 11.10 上使用 pocketsphinx python 绑定。我将语法和音频文件传递给它,它运行良好。我现在正在寻找音频文件中每个单词的时间戳。我见过:

我相信应该做我需要的。但是我似乎无法在python中找到这样做。这可能吗?

0 投票
1 回答
3037 浏览

python - Python语音比较

我有两个 .wav 文件需要比较并确定它们是否包含相同的单词(顺序也相同)。

我一直在寻找最好的方法。我不知道如何让 pyspeech 使用文件作为输入。我试过让 CMU sphinx 项目工作,但我似乎无法让 GStreamer 与 Python 27 一起工作,更不用说他们的项目了。我也搞砸了 DragonFly 也没有运气。

我正在使用带有 Python27 的 Win7 64 位。有没有人有任何想法?

任何帮助是极大的赞赏。

0 投票
3 回答
2632 浏览

java - java sphinx程序中的错误

嗨,我正在用 java 制作一个软件,我想在其中开发一个语音软件......我正在用 java 运行一个“Hello”sphinx 代码。

当我尝试运行这个程序时,我得到了这个错误......

请建议...

谢谢