问题标签 [sphinx4]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - KeyListener isShiftDown() 正在读取 shift is down 时不是
所以我正在构建一个 sphinx-4 程序,它只会在您按住 shift 按钮时进行监听。这样我就可以防止错误,并且只有在我按住 shift 按钮时它才会听我说。当我释放 shift 按钮时,我希望程序等到我再次按住它。当按下 ctrl-c 时,程序将完全退出。我正在使用 keylistener 来执行此操作。
我遇到的问题是程序确实在我按下 shift 按钮后开始收听,但是当我释放它时它不会停止收听。我不确定我的代码有什么问题。这是我创建的 MKeyListener 类中的内容:
这是我正在运行的主要课程:
我在这里做错了什么?
java - How to install sphinx4?
For the vast majority of you this will probably be straightforward, but I need help installing the sphinx4 speech recognition software. In particular, using cygwin to do so.
1) how does one set the environmental path variable to the java sdk (I had to install NetBeans)
2) Does one need to install ant if the ant libraries are already present in NetBeans?
3) Is there a better way to import the sphinx jars into my .java project in NetBeans than through using Cygwin?
I don't know where I've been going wrong and could use any and all help
speech-recognition - 如何将音频数据直接传递给 Sphinx4
我想将 Sphinx4 用于我系统的一部分。而且,我已经尝试过直接使用麦克风的 HelloWorld 演示。此外,我还看到了有关使用音频文件的示例。
所以,我的问题是,是否还有其他方法可以识别语音?例如,识别短类型数据(例如short[]
缓冲区)。
除了使用麦克风或 wav 文件(音频文件)之外,我找不到其他方法。
例如,PocketSphinx 具有processRaw
此问题(Android 上的 Pocketsphinx 输入)中描述的功能。
Sphinx4中没有对应的功能吗?
sphinx4 - 使用流数据源
我试过 LatticeDemo.java。而且,我可以得到如示例结果所示的结果。此示例使用“AudioFileDataSource”作为语音数据 (10001-90210-01803.wav)。我正在尝试使用 StreamDataSource 以不同的方式识别此语音数据。
但是,我得到了不同的结果。我想听听任何想法。
以下是我采取的步骤:
通过以下代码从 10001-90210-01803.wav 获取字节数据
/li>然后,只需将这个称为“数据”的字节数据放入 ByteArrayInputStream 中,如下所示
StreamDataSource dataSource = (StreamDataSource) cm.lookup("streamDataSource"); ByteArrayInputStream st = new ByteArrayInputStream(data); dataSource.setInputStream(st, "主流");
实际上,当我们使用“setInputStream”函数时,第二个参数(即“Main Stream”)有什么特殊含义吗?我不明白为什么需要这个论点。
streamDataSource 的配置如下:
<component name="streamDataSource" type="edu.cmu.sphinx.frontend.util.StreamDataSource"> <property name="sampleRate" value="16000" /> <property name="bigendianData" value="false" / > </组件>
输出是
问候
cmusphinx - 在 sphinx 4 中是否可以识别所有可能的单词
虽然我最初在使 sphinx 4 工作时遇到了一些问题,但现在它工作得很好。由于语法是有限的,无论是 JSGF 还是 N-Gram,我无法让 sphinx 识别每一个可能的单词或句子。我想构建类似基于语音的谷歌搜索。由于搜索可能有任何可能的单词或单词组合。在语法中添加所有字典单词很麻烦。请帮忙。
speech-recognition - 将 Sphinx4 应用于 Android 手机中录制的语音数据
这听起来很奇怪。但是,我想分析 Sphinx4 在我的 Android 手机中记录的字节数据。而且,没有好的结果。我知道这将来自我的配置问题。如果您有关于 Sphinx4 的经验和相同的经验,我想听听一些想法。
我想描述一下我的环境:
电话(Android、Nexus One)
- 采样率 = 8000
- audioFormat = AudioFormat.ENCODING_PCM_16BIT
- channelConfig = AudioFormat.CHANNEL_IN_MONO
狮身人面像4
- 采样率 = 16000
- bigEndianData = 假
- 使用流数据源
所以,我记录语音数据(byte[]),然后用 Sphinx4 分析它。以下是我的手机录制的示例语音(一二三)。
每个字节数据用“:”分隔。
java - 在 Android 上使用 Sphinx4
我对 java & android 应用程序开发真的很陌生。目前我正在做一个关于语音识别的原型应用程序。其中使用 sphinx4 语音识别。我真的不知道,Sphinx4可以在android SDK上使用吗?
使用Sphinx4.0构建语音识别。Android应用程序 (这表明它不能) https://sourceforge.net/p/cmusphinx/discussion/sphinx4/thread/ce6ee093/(但这表明它可以。)
如果是的话,我真的不知道如何使用 sphinx4,任何人都可以为我提供完成原型的指南吗?感谢您的热心帮助。
java - 如何在 java sphinx4 项目中导入和使用经过训练的声学模型
我需要帮助以 Java 语言制作一个语音识别程序我有一个训练有素的声学模型我想问你如何在我的程序中使用这个训练有素的声学模型我是语音识别平台的新手,我想在netbeans编辑器中工作,所以请给我说明测试我的声学模型,比如如果我输入与模型中使用的音频相同的音频,那么它应该播放存储在模型中的音频希望你理解我的问题,我正在研究阿拉伯语语音到语音识别plz尽早帮助我提前谢谢
sphinx4 - 如何在狮身人面像中添加单词?
如何使用java将我的话添加到狮身人面像?我是学习狮身人面像的新手,我只知道如何使用它。我想学习添加我的单词。任何人都可以帮助我。
cmusphinx - Sphinx 4 转录时间索引
当我将其设置为转录音频文件时,如何在 Sphinx 4 中获取时间索引(或帧号)?
我正在使用的代码如下所示:
我试图从结果/令牌对象中获取转录时间,例如类似于字幕制作者所做的事情。我找到了 Result.getFrameNumber() 和 Token.getFrameNumber() 但它们似乎返回解码的帧数,而不是在整个音频文件的上下文中找到结果的时间(或帧)。
我查看了 AudioFileDataSource.getDuration()[=private] 和识别器类,但还没有弄清楚如何获得所需的转录时间索引..
想法?:)