问题标签 [android-speech-api]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - Word错误率可以帮助分析口吃吗?
我正在制作接受输入音频的 Android 应用程序。并检测到口吃。
单词错误率可以检测到口吃吗?爪哇
android - SpeechRecognizer.isRecognitionAvailable() 在 Android 11 中始终为 false
正如标题所暗示的那样,SpeechRecognizer.isRecognitionAvailable()
在 Android 11 中返回 false,我不确定为什么会这样,因为设备 (Pixel 3 XL) 配备了识别语音的功能。该文档并未表明它在 API v30 中发生了更改。奇怪的是,即使isRecognitionAvailable
是假的,我仍然可以成功获得 STT 提示。下面是说明这一点的示例代码。为什么 isRecognitionAvailable 检查总是假的?代码无论如何都不完整,但我添加了重要的相关部分:
java - createSpeechRecognizer() 和 createOnDeviceSpeechRecognizer() 有什么区别?
该createSpeechRecognizer()
方法是在API level 8中添加的。该createOnDeviceSpeechRecognizer()
方法已在Android S中添加。但是它们的描述是一样的(根据官方网站)。任何人都可以澄清它们之间的区别吗?该方法在不久的将来是否有可能createSpeechRecognizer()
被弃用?
android - 之后我们将在 SpeechRecognizer 中获得 ERROR_TOO_MANY_REQUESTS 的大致限制是多少?
Android S 的 SpeechRecognizer 类中添加了一些功能。其中之一是 ERROR_TOO_MANY_REQUESTS。它表示当来自同一客户端的请求过多时会遇到此错误。了解可以安全发送的最大请求数对我们很有帮助。
java - 如何在一项活动中使用语音向具有多个编辑文本的 Google API 发送文本?
我正在使用这段代码向谷歌语音框发送意图
使用它为另一个edittext发送另一个意图
使用此代码块获取和设置数据
第二个 if 语句从未被触发,我不知道为什么。我做错了什么还是有其他方法可以做这些事情?
android - 有没有办法将音频字节发送到 SpeechRecognizer
所以我试图让一个应用程序可供聋人/HoH 人使用,到目前为止,我能够获得应用程序中当前正在播放的音频字节(我认为)。
问题是,我可以使用此 SpeechRecognizer 发送音频字节并获取文本结果吗?
找不到此方法,我想知道我是否在正确的库中执行此任务。
我查找了语音 API,但我找不到任何免费的(显然),所以我正在寻找 android 库。
任何信息对我都有帮助。
问题编辑:
是否有任何图书馆或东西可以从音频字节或任何其他需要的信息中speech to text
做到这一点?
android - 在使用 CamerX android 录制视频时使用 Speechrecognizer API
我目前正在使用 cameraX 录制带音频的视频,并且效果很好,但是现在我必须在录制视频时使用 SpeechRecognizer 并获取用户所说内容的转录。
更新:
我尝试从视频中提取音频,然后将其作为额外的内容提供给意图,但它不起作用。所以我考虑直接从 SpeechRecognizer 意图中获取音频,但这是一个死胡同,因为文档中的任何地方都没有提到 uri 或临时文件。我现在正在尝试在 SpeechRecognizer 开始收听时启动 mediaRecorder ,但这仅在第一次收听时有效。
我基本上在阳光下尝试了一切,但进展为零,有人有新想法吗?