问题标签 [cmusphinx]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - 如何使用 CMU Sphinx 4 使用英语 voxforge 模型进行语音到文本
我试图弄清楚如何将 sphinx4 或 pocketsphinx 与英语 voxforge 模型一起使用,但我无法让它工作。我曾尝试阅读文档页面(例如这个http://cmusphinx.sourceforge.net/sphinx4/doc/UsingSphinxTrainModels.html),但它对我没有帮助。
我想要的是一个可执行文件,我可以在其中指定要使用的模型以及要用作源的音频文件,并让可执行文件打印出来,这是对录音中声音的最佳猜测。
我有一些运气:pocketsphinx_continuous -infile recording.wav 2> /dev/null
但它在完整的音频文件被转录之前就中止了,并且默认模型只有很少的单词才能从音频中创建可读的文本。
我已经编译并测试了 sphinx4 源代码包中的演示,但所有示例似乎都只有几句话,需要一个模型 loke voxforge 对我有用。
我该如何设置?
speech-recognition - 使用 Sphinx4 的听写应用程序
我的要求与这个问题类似,因为这个问题现在已经 3 年了它发短信。
对于语音识别,我决定使用 sphinx4,我正在尝试增强 sphinx 提供的转录器演示。它很好,但这仅适用于特定的语法(用 .gram 和 .gxml 文件编写)。
编辑 为了能够与英语一起使用?我正在尝试使用 VoxForge_en_0.4 对其进行配置。我的 config.XML 文件如下所示:-
他们对我的配置有什么问题吗?请帮忙....
c - 如何在应用程序中使用 Sphinx3
我使用 Sphinx4 有一段时间了,它确实符合我的需求。我加载一个识别器,将音频数据传递给它,并在我的应用程序中使用识别的字符串。
现在我正在开发一个 C 应用程序(不幸的是 C++ 不是一个选项),我需要类似的东西,并认为我可以使用用 C 编写的 Sphinx3。
问题是我真的不知道它是如何在应用程序中使用的,并且没有 Sphinx4 提供的“Hello World”示例。
我已经编译并安装了 sphinxbase 和 sphinx3,现在我可以在我的应用程序中包含 sphinx 头文件。
现在我的问题:
- 是否有使用来自 C 环境的 sphinx3 的“简单”且有据可查的示例应用程序?
- 如何加载 sphinx3 引擎并使用我的二进制音频数据调用识别器?
- 或者:我是否需要启动像“sphinx3_decode”这样的应用程序并从我自己的应用程序中调用它?如果是这样,是否有一个示例应用程序?
先感谢您!
最好的问候,罗伯特
mp3 - 使用 Sphinx 4 进行 mp3 识别
我们可以在不使用 wav 文件的情况下使用 mp3 文件进行语音识别过程吗?或者我们可以从 mp3 生成一个 wav 文件,然后在不严重影响准确性的情况下进行语音识别?问题是我需要在我的应用程序中最小化通过网络传输的负载。转换中丢失的信息是否会成为影响准确性的重要因素?
php - 我可以在基于 php 的电子购物 CMS 中使用 CMU Sphinx 吗?
我想在基于 CMS 的电子购物系统中集成用于搜索的语音识别系统。这个 CMS 是用 PHP 制作的。那么 CMU Sphinx 是否支持 PHP 集成?或者还有其他方法可以完成任务吗?
python - python pocketsphinx中的单词时间戳
我在 ubuntu 11.10 上使用 pocketsphinx python 绑定。我将语法和音频文件传递给它,它运行良好。我现在正在寻找音频文件中每个单词的时间戳。我见过:
我相信应该做我需要的。但是我似乎无法在python中找到这样做。这可能吗?
python - Python语音比较
我有两个 .wav 文件需要比较并确定它们是否包含相同的单词(顺序也相同)。
我一直在寻找最好的方法。我不知道如何让 pyspeech 使用文件作为输入。我试过让 CMU sphinx 项目工作,但我似乎无法让 GStreamer 与 Python 27 一起工作,更不用说他们的项目了。我也搞砸了 DragonFly 也没有运气。
我正在使用带有 Python27 的 Win7 64 位。有没有人有任何想法?
任何帮助是极大的赞赏。
java - java sphinx程序中的错误
嗨,我正在用 java 制作一个软件,我想在其中开发一个语音软件......我正在用 java 运行一个“Hello”sphinx 代码。
当我尝试运行这个程序时,我得到了这个错误......
请建议...
谢谢