问题标签 [pocketsphinx-android]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
639 浏览

cmusphinx - 语言模型/集不包含

我正在使用PocketSphinx开发 ASR ,并且我已遵循此页面上的每一步。当我运行时,pocketsphinx_continous我收到以下错误:

我的语言模型包含和/s标签。

我的语言模型如下:

制作它的语料库文件是:

高度赞赏协助解决此问题。

0 投票
1 回答
112 浏览

cmusphinx - 声学模型小时数

我想创建一个模型来识别阿拉伯字母。我知道如何创建语言模型和字典文件,但我被困在声学模型上。我为每个字母记录了wav文件,但是在培训期间,它说培训时间太少了,尽管培训仍在继续。当我尝试使用它时,模型无法识别任何东西(给 null)。

我想知道我应该如何记录 wav 文件,我应该继续重复,例如,在一个 wav 文件中重复 100 次Alif之类的字母,还是应该只记录同一个字母的多个 wav 文件。

非常感谢您的帮助。

0 投票
2 回答
852 浏览

java - 识别字母时使用什么语法

使用语音识别我想创建一个拼写游戏,让用户说出字母。例如,用户说“S”“T”“A”“C”“K”。

我正在使用 PocketSphinx 来完成此任务。这是我的代码:

我如何识别用户说的字母?

或者有没有我可以用来完成这个的库?

0 投票
1 回答
619 浏览

android - Android pocketsphinx & Fsg 模型

语境

我目前正在构建一个 sdk/service 应用程序可以访问基于语音的命令,目前我正在使用 android pocketsphinx 来检测关键字(即“wake”),然后用谷歌语音识别分析整个句子,但是我的问题是我想让它全部离线!所以我正在通过充分利用pocketsphinx来取代谷歌语音识别......

我的问题

用户定义他想要检测的单词,之前我只是比较了所说的单词和谷歌语音语音到文本返回给我的内容......所以知道我想更新袖珍狮身人面像使用的语法用户给出的单词,这是有问题的,因为(按照android Pocket sphinx的javadoc)它只能接受语法文件!

问题

有什么方法可以即时更新 android pocketsphinx 语法?

编辑

我忘了说这个方法:( public void addFsgSearch(String searchName, FsgModel fsgModel)github pocketsphinx中)

这似乎不像任何其他语法设置器方法那样采用语法文件,而是采用类/结构?但问题是它没有记录......

0 投票
1 回答
814 浏览

cmusphinx - Pocketsphinx setKeywordThreshold() 问题

我正在考虑为我的应用程序使用 pocketsphinx 离线语音识别,但它的文档不清楚。如果有人可以回答以下问题,那么它真的会对我有很大帮助。

  1. setKeywordThreshold(1e-5f) 方法的作用(用途)是什么。此方法允许的最小值和最大值是多少。

  2. 我想为不同的语言提供支持,并在此链接http://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/上找到某些语言的内置声学模型。但由于文档滞后,我无法理解哪种模型最适合哪种语言。任何人都可以向我推荐以下语言的最佳内置声学模型 -

    (一个)。澳大利亚英语 (b)。美国英语 (c)。英式英语 (d)。加拿大英语 (e)。欧洲英语(f)。印度英语(g)。爱尔兰英语 (h)。新西兰英语(一)。南非英语 (j)。俄语 (k)。西班牙语 (l)。法语(男)。荷兰语(n)。德语

  3. 我只想识别每种语言中从 1 到 200 的数字。做这个的最好方式是什么 ?

  4. 我创建了一个 digits.gram 文件来识别从 1 到 99 的数字,但它也可以识别背景声音。例如,当钻机出现任何背景声音时,它就会将其识别为一个。只有在说出特定数字时,我们才能识别数字?

数字.gram 文件

0 投票
0 回答
370 浏览

android - pocketsphinx 法语失败

我正在使用以下代码来设置识别器(应该让您了解使用的初始化操作和模型的顺序):

我收到以下错误 - 知道为什么吗?相同的代码适用于英文模型。

0 投票
1 回答
491 浏览

android - pocketSphinx 中的新 .g​​ram 文件

使用 PocketSphinx 识别多个关键字

如上所述,我有一个正在进行的项目,并且在 digit.gram 文件中列出了一组新单词。

我对这种识别的怀疑是我想识别一个新的“.gram”文件而不是说数字,它调用了 digits.gram 。

例如,不说数字,我可以说机器人,然后将调用robot.gram,如何使之成为可能?

0 投票
1 回答
142 浏览

pocketsphinx-android - 袖珍狮身人面像安卓演示 4.4

Pocket sphinx android 演示在 LG l39c android 4.1 上运行良好。无法在 LG l34c Android 4.4 上运行

“致命信号 6 (SIGABRT) 位于 0x00000365 (code=0),线程 5046 (cketsphinx.demo)”

TTS 也有问题,从不调用 onInit(等待没有帮助)

同样,两者都可以在 LG l39c android 4.1 上正常工作。有人在 4.4 中遇到这些问题吗?谢谢

0 投票
1 回答
1454 浏览

android - 通过语音命令从摄像头捕获

我正在开发一个简单的语音控制相机应用程序。我正在使用 CMUsphinx 库来启用语音识别。

在我的应用程序中有两种捕获方法。一种是单击按钮时,另一种是通过语音命令。单击按钮时,将捕获并保存图像。但是当给出语音命令时,它会显示以下异常。

我已正确授予权限。

这是我的活动代码:

SpeechRecognizor.java

如果你想测试它,我会分享我的项目代码。

更新:

请在下面找到我的项目:

Githubhttps ://github.com/mittu-spidey/SayCheese

谷歌云端硬盘https ://drive.google.com/file/d/0B_L5g7q6wyKOQklTSWFWeGpUWVk/view?usp=sharing

0 投票
1 回答
981 浏览

mfcc - 如何在 Android 上的 PocketSphinx 中提取 MFCC 特征

我最近下载了适用于 Android Studio 的 PocketSphinx Android Demo。它适用于我的 Galaxy S5,我对准确性感到惊讶。但是,出于以下几个原因,我正在努力提取 MFCC 功能:

  1. 有一个解释如何使用 FrontEnd 类来生成 MFCC 功能,但它是为 Sphinx-4 实现编写的。我应该如何以及在哪里实现包含以下行的 sphinx 属性文件:

    <"组件名称="mfcFrontEnd" type="edu.cmu.sphinx.frontend.FrontEnd">

  2. 这导致了我如何在 PocketSphinx 中使用 Sphinx-4 库的问题?