问题标签 [sphinx4]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
build - sphinx 语法位置找不到资源
使用 ant 构建 JSGFDemo 时,一切正常。运行 JSGFDemo.jar 构建工件没有任何错误。但是,当使用在 eclipse 中导入的源文件夹,并将 lib/ 目录中的 jars 添加到构建路径时,程序错误并显示以下消息:
ConfigurationManagerUtils.class.getResource(resourceName);
由于某种原因,对in的调用ConfigurationManagerUtils.resourceToURL(String location)
似乎为 location = "resource:/edu/cmu/sphinx/demo/jsapi/jsgf/" 返回了不同的结果。(null,或有效的 URL 对象)
作为旁注,我认为 getResource("/path/to/a/dir/not/file/"); 当它解析为 jar 内的路径时无效。
一段时间以来,我一直在努力解决这个问题,但看不出我做错了什么。
cmusphinx - sphinx 中的一次迭代后麦克风未启动
我正在使用 CMU sphinx 库,但在成功运行一次迭代后,出现此错误“无法打开格式为 PCM_SIGNED 16000.0 Hz、16 位、单声道、2 字节/帧、不支持大端序的麦克风线。” 无法启动麦克风。在 ubuntu 12.10 的 eclipse 上运行时,代码在所有迭代中都能正常工作。为什么在 Windows 7 中使用 eclipse 时会出现此错误?
cmusphinx - 在 sphinx 4 的语法中添加更多单词后,识别器无法有效工作
我增加了语法的大小,因此通过使用不同的 HMM 在字典中添加了更多具有不同口音的单词。但是识别器没有有效地工作并且使用荒谬的词或者可能没有响应。它主要发生在语法中添加大词的情况下。例如,我在语法中添加了诸如 stackoverflow 之类的单词,并在字典中进行了条目。但它不承认它。请帮忙。
cmusphinx - 在 Sphinx 4.0-“helloLinguist”属性中出现以下错误:“语法”-未设置强制属性
我正在使用 sphinx 4.0 识别器。在运行我的应用程序以在运行时交换两个静态定义的语法时,我在 ecllipse 中收到错误为“'helloLinguist' property:'grammar' - 未设置强制属性!”。我正在使用链接http://cmusphinx.sourceforge.net/wiki/sphinx4:swappinggrammars上提供的配置 xml 文件。请帮忙。
speech-recognition - Sphinx 4:用短停顿发音的单词识别 wav
我是 Sphinx 4 的新手,正在尝试制作简单的数字识别应用程序。我有一组带有 3 位数字的 wav,发音为短暂停(如 one_five_nine.wav)用于测试。问题是文件识别在找到第一个数字后停止,所以我只有“一个”作为 one_five_nine.wav 的输出。
这是我的前端配置
和代码
谢谢你的帮助。
java - Sphinx 词法错误解析语法文件
我一直在用 Java 制作一个语音识别程序,只是为了看看它是如何工作的。直到一天前,一切都运行良好。我不知道发生了什么,因为我没有更改代码中的任何内容。
由于它出现了一个词法错误,我想我只需要粘贴我的语法文件。
控制.gram:
错误日志:
我尝试删除所有空白字符,将其编码为 ANSI、UTF(带和不带 BOM)。所有这些都无济于事......
有人能帮我一下吗?
speech-recognition - 在为我的本地语言开发语言模型时是否需要降噪算法
我正在为我的本地语言开发声学模型和语言模型,并计划将其与pocketsphinx 和 sphinx4 集成。
现在我想问一下,我是否需要为我的本地语言实施降噪算法以提高传输准确性,或者袖珍狮身人面像会采用这种算法吗?如果是,我需要,那么我应该遵循哪些步骤来集成降噪算法?
noise - 如何设置可接受的最低识别精度?
我需要识别长语音音频文件(wav)中的关键词。可能有不同的噪音、咔哒声、叮当声等。这些声音通常被识别为关键字。
如何设置一些阈值来正确区分单词?
speech-recognition - Sphinx4 的配置管理器从查找返回 null
我在按照本教程使用 Sphinx4 和 Java-Speech-API 创建语音识别时遇到了一个问题。我所做的与作者在他的博客中所做的完全相同,但是当我执行我的程序时,我收到了 NullPointerException
有可能是安全问题吗?如果是一个,我该如何解决?
感谢您的帮助,祝您有美好的一天。
nlp - ARPA 语言模型文档
在哪里可以找到有关 ARPA 语言模型格式的文档?
我正在开发带有袖珍狮身人面像 STT 引擎的简单语音识别应用程序。出于性能原因,建议使用 ARPA。我想了解我可以做多少调整我的语言模型以满足我的自定义需求。
我发现的只是一些非常简短的 ARPA 格式描述:
- http://kered.org/blog/2008-08-12/arpa-language-model-file-format/
- http://www.speech.sri.com/projects/srilm/manpages/ngram-format.5.html
- http://www.speech.cs.cmu.edu/SLM/toolkit_documentation.html
我是 STT 的初学者,我很难理解这个(n-gram 等)。我正在寻找更详细的文档。类似于 JSGF 语法的文档在这里: