问题标签 [voice-recognition]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
android - 捕获发送到 Google 语音识别服务器的音频
为了通过 Google 服务器识别语音,我将 SpeechRecognizer 类与 RecognitionListener 结合使用,如Stephan对这个问题的回答中所建议的那样。此外,我尝试使用来自 RecognitionListener 的 onBufferReceived() 回调来捕获正在识别的音频信号,例如:
这似乎工作正常,除非 SpeechRecognizer 无法连接到 Google 服务器,当音频块没有复制到上述sig
数组中,并且抛出 HTTP 连接超时异常。SpeechRecognizer 最终连接到 Google 服务器,识别结果表明接收到完整的音频信号;只有sig
数组缺少一些音频块。
有人遇到同样的问题吗?任何解决方案的提示?谢谢!
c# - 带有 Windows 语音识别的麦克风音量的最小截止
我正在使用 Window 的语音识别 API,它会不断检测到非常低的背景噪音作为“如果”这个词。我一直在尝试找到一种方法来设置最小音量要求以开始接受输入,但它的所有成员都设置为只读。
如何设置麦克风音量的最小截止?
编辑:想出一种方法来获取平均值并忽略文本,如果它低于我想要的平均值
html - HTML5 语音输入和谷歌翻译文本到语音,Chrome 中的问题
我正在创建一个语音/文本备忘录 Web 应用程序。这里: http: //gustavstromberg.se/sandbox/html5/localstorage/看看它的源码(很短,大部分是css)
这是:
- 据我所知,语音识别仅适用于 chrome。
- 本地存储,将笔记存储为文本。
- 谷歌翻译文本到语音。
一切正常,但在不同的浏览器中。语音输入完美,仅在 chrome 中。文字转语音在 safari 中工作。
要将备忘录动态加载到我使用的音频>源元素中:
(localStorage['memory'] 包含我存储的文本备忘录)
要使用谷歌的文字转语音功能播放我最近保存的备忘录,我使用:
(spokenmemory 是我的音频标签的 id 属性)
这在 chrome 中不起作用,但如果我访问翻译链接(例如:http ://translate.google.com/translate_tts?tl=en&q= Japan,我的文本备忘录是“日本”)单独的浏览器选项卡,然后返回我的站点并重新加载页面(保存相同的文本备忘录“日本”),播放正常。多么奇怪,多么令人讨厌!
有人知道这种奇怪的行为吗?
android - Android 语音识别 - 获取使用的语言
我正在使用 Android 语音识别意图,但我想知道用户设置了什么语言来进行识别。RecognizerIntent上的文档暗示您可以从意图数据中获取此信息,但我一直为空。
调用 Intent 时这些值是否可用?还有其他方法可以获取这些数据吗?
这就是我所说的意图:
我得到这样的结果:
android - Android连续语音识别?
可能重复:
Android 中的连续语音识别
我了解当前的语音识别方法,您可以让用户单击按钮来识别短语。但是有谁知道连续语音识别是否可行?例如,使用语音命令控制手机(无需单击按钮)以启动应用程序或向视障者或驾驶汽车的人提供交互式信息。
xml - 在 grxml 文件中切换识别项
我创建了一个语法(grxml 格式)来识别 OMV 文字(使用 hu-hu 语言设置)
这是有问题的部分:
细微差别识别它,并打印'oemfau',但我希望细微差别说,这个词不是oemfau,而是OMV。怎么换字?
android - Android语音识别所有结果都在一个数组索引中
我正在尝试解析 Android Voice Recognition Activity 的结果,并发现所有单词(用空格分隔)都在数组的第一个索引中。
我期待它将所有单词放入数组的每个索引中。
android - 与语音识别 Google API android 相关
Voice Recognition API 在听完声音后会生成一个建议列表。我想知道,最可能的建议总是排在最前面吗?还是只是随机的。我需要这个来进行计算以确定准确性。
android - 语音识别命令 Android
因此,当用户想要执行语音命令但找不到任何解决方案时,我已经广泛搜索了有关删除 Google 语音识别 UI 对话框的问题的某种解决方案。我正在尝试实现一个向用户显示菜单的应用程序,用户可以单击选项或大声说出将打开新页面的选项。到目前为止,除非我使用 Googles RecognizerIntent,否则我无法实现这一点,但我不希望弹出对话框。有人有想法么?或者有没有人解决了这个问题或找到了解决方法?谢谢
编辑:作为一种妥协,也许有一种方法可以将对话框移动到屏幕底部,同时仍然能够查看我的菜单?