问题标签 [sphinx4]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
3535 浏览

java - 使用 sphinx4 识别所有英文单词

我在使用 sphinx4 识别所有英文单词时遇到问题。我将所有以字母'A'开头的英文单词添加到我的java语法文件中并尝试运行它。第一次它给了我java堆空间的错误,我最初保持256m。然后我把它改成512m。这次没有来自 java 的错误,但是识别器没有识别一个单词,甚至没有识别错误的单词。谁能帮我制作一个包含所有英文单词的语音识别语法文件...

这是我在这里的第一个问题,所以希望能得到一些好的结果。

0 投票
1 回答
1325 浏览

mp3 - 使用 Sphinx 4 进行 mp3 识别

我们可以在不使用 wav 文件的情况下使用 mp3 文件进行语音识别过程吗?或者我们可以从 mp3 生成一个 wav 文件,然后在不严重影响准确性的情况下进行语音识别?问题是我需要在我的应用程序中最小化通过网络传输的负载。转换中丢失的信息是否会成为影响准确性的重要因素?

0 投票
1 回答
162 浏览

noise-reduction - 如何将噪声混合到“原始”文件(AN4 数据库)

我正在研究降噪。谁能告诉我如何将噪声文件与音频文件混合?我正在使用 AN4 数据库,所以它们都是“原始”格式。提前致谢。

0 投票
3 回答
2632 浏览

java - java sphinx程序中的错误

嗨,我正在用 java 制作一个软件,我想在其中开发一个语音软件......我正在用 java 运行一个“Hello”sphinx 代码。

当我尝试运行这个程序时,我得到了这个错误......

请建议...

谢谢

0 投票
1 回答
633 浏览

java - 可以使用麦克风录制一次声音,但无法第二次启动麦克风

我正在使用 CMU sphinx 库来录制声音。当我开始我的 java 应用程序时,我只分配了一次识别器和配置管理器,如下所示:

此外,我的应用程序中有一个录制声音按钮。当用户点击它时,我使用下面的代码来录制声音:

这是我第一次这样做的时候。但是,如果用户第二次单击录制按钮,则会引发错误“无法启动麦克风”。我在这里做错了什么。为什么我第二次无法获取麦克风

0 投票
1 回答
1309 浏览

machine-learning - 将 CMU Sphinx 的置信度分数转换为概率时的偏差

我正在尝试将 CMU Sphinx 识别器的输出(即列表 < 假设(即短语)、分数(在日志中)> 通过调整 test_ps_nbest.c 获得)转换为以下形式:列表 < 假设(即短语)、“概率”(介于0 和 1) >

我现在使用的一个简单方法如下:

  1. 将每个置信度分数除以语言权重(例如:11)
  2. 标准化对数域中的置信度得分列表
  3. 输出概率 = exp(归一化置信度得分)

问题是上述方法的输出概率是有偏差的。你有什么建议可以用来获得概率偏差吗?

我必须实施以纠正偏差的示例方法:

矢量<双> getBias(矢量<字符串>短语,矢量<双> logConfidenceScores)

上述讨论的示例输入:

<“他在我们的头部心脏肺中做了标记”,-43278 >

< “他在我们班上拿了钱,他做了标记”,-43449 >

<他在心脏和肺上得到了能量并且他做了标记”,-43368 >

0 投票
1 回答
1180 浏览

sphinx4 - 使用带有 sphinx-4 的 HTK 声学模型

我一直在使用 sphinx-4 作为语音识别工具,我仍在尝试学习该工具。我有一个使用 HTK 开发的阿拉伯语声学模型。我想知道如何在 Sphinx-4 中使用这个声学模型。

0 投票
0 回答
299 浏览

android - 显示音素而不是文本 [pocketsphinx]

我已经在我的 Android 设备上成功编译了 PocketSphinx 的 HelloWorld 教程。
[链接:http://cmusphinx.sourceforge.net/2011/05/building-pocketsphinx-on-android/]

现在,我需要一些帮助来调整 HelloWorld 教程的代码,以便在屏幕上只显示口语单词的音素而不是文本。

0 投票
1 回答
257 浏览

java - java Sphinx中的createRecognizer

当我检查 Oracle 文档中的 javax.Speech.Recognizer 类时,我发现了这个描述 createRecognizer 方法的语句。“创建具有指定所需属性的识别器。如果没有具有所需属性的识别器,则该方法返回 null。” 如果没有识别器,这里是什么意思?我们不是在这里创建一个新的识别器吗?

0 投票
2 回答
1541 浏览

java - 如何将 Sphinx 4 与 Freeswitch 集成,接收通话音频并进行一些识别

我有在 Freeswitch 上设置 IVR 的工作知识。我已经安装了 Sphinx 4,它适用于从麦克风捕获的语音。但是我想将 FS 与 Sphinx 4 集成。

我在某处读到它说它需要像 Cairo 这样的 MRCP 服务器才能将 FS 与 SPHINX 集成。真的需要像开罗这样的东西吗?FS 自带 PocketSphinx……但我想用 Sphinx 4。请告诉我如何集成 Sphinx4 和 FreeSwitch。