问题标签 [pocketsphinx]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
pocketsphinx - 如何让pocketsphinx忽略字典中不存在的单词
我有一个需要发现的关键字列表,但有些单词不是“真实单词”(例如,abracadabra),显然它们不在字典中。
我的问题是如何忽略它们?(pocketsphinx 返回错误并停止)。我阅读了 pocketsphinx_continuous 的手册,但没有找到合适的参数。
speech-recognition - 在 pocketsphinx 中指定声学模型的路径
我想构建一个基于音素的小“对话系统”,它可以收听语音,将其转换为一串音素(无论多么错误都无关紧要),处理/存储这些并在音素级别播放它们。我的目标是使用节日/mbrola 或 espeak。都在树莓派上运行(该项目称为 babble pi)。
我在这里遵循了非常好的说明: https ://wolfpaulus.com/jounal/embedded/raspberrypi2-sr/
而且我还通过以下命令得到了很好的认可:
现在我已经在 sourceforge 网站上阅读了这篇关于音素识别的文章:http: //cmusphinx.sourceforge.net/wiki/phonemerecognition
并且还意识到显然 prealpha5 具有新的二进制格式。关于音素识别器的文章指出,基本上英语音素识别器是默认安装包的一部分,因此邀请通过以下方式对其进行测试:
我假设音素文章指的是旧版本的 (pocket-)sphinx,因为它指的是 .dmp 而不是 .bin 文件扩展名,所以我尝试了:
但我收到以下错误:
查看 en-us,实际上只有一个 .dict、一个 .lm.bin 和电话文件。和另一个包含 mdef 文件以及其他几个文件的 en-us 目录。复制它没有帮助。
那么该怎么办?卸载 prealpha5 并安装版本 4?或者我可以在某处下载正确的文件吗?
dictionary - CMUsphinx 将单词添加到现有字典
我已经为pocketSphinx 创建并测试了C hello world 应用程序,它运行良好。然后我下载了一种法语模型语言,除了解码器无法识别的非法语品牌(如 Spotify)之外,一切都很棒。
这很正常,它们不在french.dic
文件中,所以我在文件中添加了一个条目french.dic
:
但没有任何改变,pocketSphinx 无法识别 Spotify。
我还创建了一个小自定义词典和一个只有 3 个单词的小语法,但与其他 2 个单词相反,从未识别出“Spotify”。
我是否需要做其他事情才能让 PocketSphinx 识别新单词?
编辑:
我做的小语法:
和小字典:
录音链接:https ://www.dropbox.com/sh/j3qj13vps5bw0ni/AAAR2ELJLDAadMptMPmLZ4jna?dl=0
pocketsphinx - 使用 PocketSphinx 进行音素识别
我需要 Windows 8 桌面上麦克风的实时音素识别。所以我关注了http://cmusphinx.sourceforge.net/wiki/phonemerecognition并从 VS2013 中的颠覆源构建了 pocketsphinx_continuous。以管理员身份在命令行中运行它:
在最后的 INFO 行 Windows 8 抛出此错误:
PocketSphinx 调试输出或我的命令行选项有什么问题吗?还是纯粹的 Windows 问题?我注意到这个文件夹:/bin/Release/Win32。我的 Windows 8 在英特尔 NUC 上是 64 位的。Sphinxbase.dll 是在 Debug 模式下从 subversion 编译的,而 PacketSphinx 只有 Release 模式。
我还在某处读到音素计时信息可用 - 如何获得它?
补充:按照 Nikolay 的建议,使用这些参数,我消除了错误,但没有得到音素:
获取音素输出的正确命令行参数集是什么?
grammar - JSGF 文件是否只使用一个公共规则?
我将以下 JSGF 文件与 pocketsphinx 一起使用(法语对不起):
它完美地工作。但是,如果我删除<final_rule>
标签并改用多个public
关键字,如下所示:
不管我说什么,pocketsphinx 只承认三个公共规则之一。我觉得这种行为很奇怪,因为在使用这个语法文件运行时,pocketsphinx 不会给我错误。JSGF 文件是否只需要一个公共关键字还是链接到 pocketshphinx ?
python - python - 如何在Python中使用带有pocketsphinx的jsgf语法文件检索单词的规则名称?
我在 python 中使用 pocketpshinx 使用 JSGF 语法文件进行语音识别。语法由规则组成,语音与要识别的规则相匹配。
识别效果很好,但我似乎无法找到如何检索每个单词的规则名称。我对标签不感兴趣,因为我读到它没有在 pocketsphinx 中实现,只是在规则名称中。例如,使用我刚刚编写的这个简单的语法文件:
如果识别的语音是“请在此稍等,谢谢”,我希望能够检索“命令”部分(“在此稍等”)并对其进行操作。我已经读过可以使用正则表达式,但我真的不明白是否已经在pocketsphinx中处理了一些东西(这会很棒)或者我是否必须自己构建一些东西。如果没有必要,我不想重新发明轮子。=)
speech-recognition - Problems loading language model in DMP format in CMU Sphinx
I tried compiling CMU Sphinx from source and tried to recognize voice commands using mic . My command looks like this:
I get an error saying that en-us.lm.bin is not a dump file. What am I supposed to do now?
speech-recognition - 如何为 pocketsphinx 创建离线 .dic 文件
如何为 pocketsphinx 创建离线 .dic 文件?我曾经使用http://www.speech.cs.cmu.edu/tools/lmtool-new.html但它不起作用。所以我创建了 .lm 文件
我尝试使用http://www-i6.informatik.rwth-aachen.de/web/Software/g2p.html创建 .dic 文件,但没有成功。G2P 已构建,但无法转换我字典中的单词。
speech-recognition - 识别孤立的单词而不是单词组合
我正在尝试使用字典来提高pocketsphinx的准确性。我给出了一个单词列表,例如
很多时候我注意到它给了我这些词的组合结果
有没有办法解决这个问题?任何表示只输出其中一个词而不是组合的标志。