问题标签 [android-speech-api]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
android - 录音测试
我有一个 Google Speech API android 项目,我想为语音识别创建测试,但我不知道我该怎么做,我看到有些人有“布鲁克林大桥有多旧”(audio.raw 文件) 但我看不到如何在我的测试中使用它,有什么想法吗?
android-studio - 如何知道文本转语音是否已完成通话?
我正在尝试制作一个文本到语音应用程序,我的所有代码都很好。我想在它完成讲话后执行一些代码。我不知道该写什么以及在哪里写该代码。我尝试找到许多解决方案,但它们对我不起作用。请帮帮我。提前致谢。
任何帮助,将不胜感激 :)
java - TextToSpeech 无法正确停止
我有一个刷新的文本,每次发生这种情况。
speak()
我用这种结构调用位于另一个类中的静态方法方法:
问题是,如果我off()
在多次speak()
调用后调用,tts 会继续说话。如果我speak()
只调用一次而不是像刷新方法中发生的那样多次调用,则不会发生这种情况。这使我怀疑该off()
方法不适用于所有实例,尽管我已将所有new TextToSpeech(...)
调用分配给类中的相同静态字段Voc
。
我该如何解决这个问题?
android - 说话失败:TTS 引擎连接未完全建立
我正在开发一个研究应用程序,其中手机使用语音从表单中读取用户问题(我使用 TextToSpeech 来读取问题),并且用户必须通过说话来填写表单,我正在使用 SpeechRecognizer 类。
我正在使用 UtteranceProgressListener 来检测电话何时停止通话,以便我可以启动 SpeechRecognizer。但每次,手机都会跳过应用程序中的第一个问题,只问最后一个问题。我不明白为什么会这样。我将不胜感激任何帮助或对此的见解。
最重要的是,我在我的日志中得到了这个,我什至不确定它是否与问题有关。
W/TextToSpeech:setLanguage 失败:TTS 引擎连接未完全建立
说话失败:TTS 引擎连接未完全建立
这就是代码:我写了两个 UtteranceProgressListeners,每个问题一个。
android - 用于数字和电子邮件 ID 的 Android 语音转文本
我正在使用 Android Speech to text 进行语音识别。
我在获取电话号码和电子邮件 ID 时遇到问题。它没有给出正确的结果。
假设如果用户说“三二三三五百一”在这种情况下,STT 应该给我 222333501,但它给出了一些数字和字符串作为结果。
假设如果用户说“abc_cde@gmail.com”,在这种情况下,它也以字符串的速率和下划线给出。
有没有办法解决这个问题。我已经提到了一个 java 实用程序 将单词转换为数字以将字符串转换为数字(如果有效),但我不确定这是否适用于所有情况。任何帮助表示赞赏。
android - SpeechRecognizer 错误 4 ERROR_SERVER - 服务器发送错误状态
谷歌是什么意思 - “服务器错误”?这不是一个特别有用的错误。有没有人见过这个错误?
我在这里发布代码。代码通常可以正常工作,而且只有很少的设备会发生这种情况,所以我想这更多地与设备的配置有关。
android - 调整 Android Speech-to-text 识别中的背景噪音敏感度
Android Speech-to-text 对背景噪音非常敏感。用例是在浅背景噪声恒定的区域中使用语音到文本。只想控制特定语音级别的语音识别。
尝试使用Speech Recogniser 的 RMS 和缓冲区输入来解决问题。一些使用相同逻辑的解决方法会有所帮助。
从 Android 语音到文本识别器返回的回调是:
speech-recognition - Web SpeechRecognizer 与 Android/iOS SpeechRecognizer 相比如何?
如果要在Web SpeechRecognizer
和Android/iOS SpeechRecognizer
(主要Android
还是整体移动)之间进行选择,两者的优缺点是什么?
标准:离线/在线识别、语言支持、处理速度、识别文本的保真度、持续聆听、限制等
个人经验也值得赞赏:)
android - 如何防止Android SpeechRecognizer被破坏后发出噪音?
我正在使用android.speech.SpeechRecognizer
并且遇到一个问题,即使在我调用了它的 , 和方法之后它也会发出独特的stopListening()
铿锵cancel()
声destroy()
。
这是我创建和销毁SpeechRecognizer
in 的方法MainActivity.kt
。
这是我的日志:
我正在运行 Android 10 的 Pixel 2 上测试代码,并使用minSdkVersion
21 和targetSdkVersion
28 进行编译。
谁能告诉我我可能做错了什么或者图书馆中是否有错误?
我目前有一个笨拙的解决方法,我在关闭识别器后将媒体音频流静音。
java - Android SpeechRecognizer:cancel() 和 stopListening() 被完全忽略(但仅限于 Android 9 和 10)
我有一个使用 Kotlin 编写的 RecognitionListener 的项目。语音转文本功能是成功的,但在 Android 9 或 10 设备上测试后出现了一些问题。
在我开始使用 startListening() 函数收听后,它实际上会在一段时间不活动后停止(在 1 秒内)。我添加了一些功能,以便用户可以通过按钮停止并获得结果,或者通过按钮取消并忽略结果。它在 Android 8 设备上进行了很好的测试。但是当我在 Android 10 设备上进行测试时,它从来没有工作过。(也在 Android 9 和 Android 10 的不同设备上测试过......同样的问题)
这是 VoiceRecognition 语音转文本类代码:
如您所见,我提到的函数是endListening()
和cancelListening()
。调用这些函数时,您实际上可以看到 Log,但是如果当前设备使用的是 android 9 或 10,则 cancel() 或 stopListening() 将不会有任何效果。即使 line voiceRecognitionLayoutChanger?.endListeningChangeLayout()
fromcancelListening()
被执行并带来所需的结果(更改应用程序内的布局)。
android.speech 库有问题吗?或者……有办法解决吗?