问题标签 [sfspeechrecognizer]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
ios - Swift:尝试快速将语音更改为 iPhone 的声音时,iPhone 的音量很低
我正在尝试语音识别示例。如果我开始通过麦克风识别我的语音,那么我会尝试让 iPhone 发出识别文本的声音。这是工作。但是,声音太小了。你能指导我吗?
而不是,如果我尝试简单的按钮操作,使用AVSpeechUtterance
代码,音量是正常的。
之后,如果我选择startRecognise()
方法,音量太低。
我的代码
我的按钮操作
c# - ios应用中的离线语音输入
现在我正在使用SFSpeechRecognizer开发带有语音到文本的 ios 应用程序。它在连接互联网时运行良好。但是当没有互联网连接时,它无法按预期工作。有没有办法在离线时实现语音到文本功能。(输入:日语语音)
用于开发的工具:
参考网站:
http://dev.classmethod.jp/smartphone/xamarin-ios-practical-translator/
请帮助解决我的问题。提前致谢。
ios - 如何改进 ios 中数字输入的语音识别?
我正在使用 ios 语音识别,只要有足够的上下文,它就会做得很好。我仅将语音识别用于数字输入并且遇到了问题。例如,使用单个数字(如 2 - to, too 或 8 - ate);没有足够的上下文。甚至有一些两位数的数字(80 有时被翻译为白痴)。我想向语音识别器表明输入将是数字。例如,如果输入是“数字 2”,那么语音识别器的工作就非常出色。
我玩过一些提示——SFSpeechRecognitionTaskHint(未指定、听写、搜索、确认)——但这些模式都不太适合数字输入。
所以,问题是:
- 有没有办法向 SFSpeechRecognizer 提示音频将是数字的?或者
- 是否有另一种可能更适合我的需求的语音识别器技术?
另请注意,我希望它也可以使用多种不同的语言(不仅仅是英语)。
谢谢你的帮助,埃里克
ios - 错误域=kAFAssistantErrorDomain 代码=209 "(null)"
我正面临一个问题SFSpeechRecognizer
。启动应用程序几秒钟后,我开始收到错误
错误域 = kAFAssistantErrorDomain 代码 = 209 "(null)"" 和 "错误域 = kAFAssistantErrorDomain 代码 = 203 "超时" UserInfo={NSLocalizedDescription=Timeout, NSUnderlyingError=0x170049990 {错误域 = SiriSpeechErrorDomain 代码 = 100 "(null)"}}
并且应用程序停止识别。
我正在尝试endAudio()
每 20 秒重新启动一次,因为 Apple 不允许我们识别超过一分钟。
对此的任何帮助将不胜感激。
ios - Swift Numbers 将文本命名为 Int
我刚刚实现了 SFSpeechRecognizer,因为我希望它指示一些数字,但我遇到的问题是,如果我说“一”,则 result.bestTranscription.formattedString 是“一”,但如果我说“十”,则结果抛出“10”,我怎样才能设法获得由实际数字而不是交响乐“一”来表示的单个数字。
android - 使用 SpeechRecognizer 和 MediaRecorder 同时进行录音和语音识别
我正在尝试同时录制音频和进行语音识别。他们每个人都单独工作,但在一起只有录音工作。
代码如下所示:
当调用这两个方法时,会调用 onReadyForSpeech 回调,但没有任何反应。当只调用 startRecognition() 时,语音识别工作正常。
我猜这是因为语音识别器也在使用麦克风的缓冲区,但我想知道如何解决这个问题?
编辑:我不打算使用云 API 或任何其他非离线 API(如其他类似问题中所建议的那样)。此外,采用 FLAC 方法可能会失去获得部分转录结果的能力。我仍在考虑使用,但如果可能的话,我更喜欢更标准的非 jni 替代品。
ios - Swift SFSpeechRecognitionTask 未取消
我正在使用 Swift 中的语音识别并在取消时遇到问题SFSpeechRecognitionTask
。
我已经实现了以下逻辑:
- 我有一个麦克风按钮
- 按下按钮时正在识别语音
- 当麦克风按钮被释放时,我需要完成语音识别,以在完成块中获得结果(
recognitionTask
用于它)。所以我stopRecording()
为此目的使用函数。此功能正常工作。 recognitionTask
当我做一些其他逻辑时,我也需要取消。所以我需要recognitionTask
立即停止完成处理程序并返回错误或结果。为此,我写了cancelTask()
. 我试过这个函数的不同变体,但不起作用。问题是当应用程序以慢速互联网连接(例如边缘)运行时,我总是在延迟一段时间后完成。
我recognitionTask.isCanceled
刚刚检查过recognitionTask?.cancel()
,这个属性总是false
. 任何想法为什么这不起作用?
android - android.speech.RecognitionService SecurityException 与一些第 3 方语音识别器
我们创建了一个使用 Google 语音识别器的 Android 应用程序,我们首先在程序中选择使用 Google 语音识别器。大多数设备工作正常,只有少数设备(MEIZU_M5、U78-E、Apollo Lite 等)报告以下异常。好像和联发科的语音指令有些冲突?我们发现其他一些联发科的设备工作正常。这令人困惑。
要追溯代码,源代码只显示到 ContextWrapper.java。如何让它显示到 ContextImpl.java:1421?
通过 firebase 日志,我们发现它发生在许多 3rd 方语音识别器中:
我们还测试了其他一些运行良好的第 3 方语音识别器。那些导致异常的语音识别器是否仅用于系统语音命令而无法访问应用程序?
欢迎任何想法或经验。
c# - 在 C# 中访问语音识别信号的样本?
如何访问由语音识别引擎处理的信号样本?[C#]
基本上我的程序可以很好地识别语音,但是我如何才能访问识别信号的特定样本?我知道我可以选择:
但它没有给我我想要的数据。我想要一个整数或其他东西的向量。请帮忙
ios - SFSpeechRecognizer kAFAssistantErrorDomain Code=203 "重试"
我使用SFSpeechRecognizer,基本上可以工作。
1.但有时会出现以下错误。而且主要是在我没有执行之前avStop()
。
[实用工具] +[AFAggregator logDictationFailedWithError:] 错误域=kAFAssistantErrorDomain Code=203 "重试" UserInfo={NSLocalizedDescription=重试, NSUnderlyingError=0x1c464b880 {错误域=SiriSpeechErrorDomain Code=1 "(null)"}}
2.并且完全无法在后台工作,会产生如下错误。
[实用程序] +[AFAggregator logDictationFailedWithError:] 错误域=kAFAssistantErrorDomain 代码=1700 "(null)"