问题标签 [dictation]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
109 浏览

keyboard - iOS8:调整视图约束后听写键盘消失

我们在键盘出现之前使用约束来调整视图。在 UIKeyboardWillShowNotification 通知上进行调整。

问题是当用户切换到“听写”键盘时,键盘会出现并立即消失。问题似乎是约束调整的结果(self.gapViewConstraint.constant = height),并且只发生在 iOS8 上(iOS8 中添加了 as-you-speak 文本识别)。

任何想法如何在不消除约束的情况下解决?

0 投票
1 回答
1113 浏览

objective-c - Siri 听写绕过 UITextView:shouldChangeTextInRange 委托

我用来(BOOL)textView:(UITextView *)textView shouldChangeTextInRange:(NSRange)range replacementText:(NSString *)对输入到UITextView.

这很好用,甚至可以处理可能包含无效字符的粘贴文本。

但 Siri 似乎并不关心这些事情,而是将它的听写直接转储到(void)textViewDidChange:(UITextView *)theTextView,绕过shouldChangeTextInRange委托并避免验证检查。

这对我来说似乎是一个安全漏洞,并破坏了所有其他输入通道遵循的 API 流程。

关于如何让 Siri 听写符合呼叫的任何想法shouldChangeTextInRange

0 投票
1 回答
274 浏览

c# - .NET 预定义文本的语音识别

我正在开发一个应用程序,用户在其中阅读一些预定义的文本,我们使用语音识别引擎来记录他所说的内容。然后我们将结果与预定义的文本进行比较,以找出他正在阅读的句子或文本的一部分。

我们使用 Nuance NDev 作为我们的语音识别引擎,但现在成本太高,我们正在尝试寻找另一种替代方案。

所以我正在尝试使用 .NET 语音识别引擎,但我无法找到实现这一目标的方法。

根据我的测试:

  • 听写语法很好,因为它可以翻译用户说的每个单词,但结果非常混乱,因此几乎不可能找到匹配项。

  • GrammarBuilder 和 Choises 类的混合更像是一个命令 => 动作类型的东西,它不会翻译用户说的所有单词,它只是搜索一个特定的单词/命令并打印出来。

所以我想知道是否有一种方法可以通过听写行为获得语法,但只能使用单词的子集,比如我预定义文本中的所有单词,或者让我设置单词/句子来帮助识别引擎的东西.

例如,如果我给引擎这个预定义的文本:

一天早上,当格里高尔·萨姆萨从噩梦中醒来时,他发现自己在床上变成了一只可怕的害虫。他躺在盔甲般的背上,稍微抬起头,就能看到棕色的腹部,略呈拱形,被拱门分成坚硬的部分。

它将只能从该文本中返回单词。所以识别会更容易,更准确。

如果您对如何实现此目标或任何其他替代方案有任何想法,我会全力以赴。唯一的限制是它必须支持英语法语

谢谢。

0 投票
0 回答
282 浏览

speech-recognition - 用于连续语音识别的 OS X Yosemite (10.10) API

OSX 现在已经为多个版本内置了连续语音识别。

现在非常好。

OSX 10.10 是否有用于这种连续语音识别引擎的 API?

谷歌搜索告诉我,大约在 2009 年,只有 NSSpeechRecogniser (在 OSX 上相当于 MS SAPI sdk

谁能确认这是否仍然如此?

我问是因为我正在考虑构建自己的集成 UI,这将是 Leap 控制器和语音输入的混合体。

如果我能使用 OSX 的引擎,那就太棒了。否则,我认为我没有任何其他好的/可行的选择。

0 投票
1 回答
1064 浏览

ios - 知道听写何时在 UITextView 中结束

我想知道听写什么时候结束(最好是什么时候开始)。

我的UIViewController其中包括UITextView符合UITextInputDelegate协议的。

为了使它工作,我必须订阅UITextInputCurrentInputModeDidChangeNotification

并在那里添加委托(仅将其添加到viewDidLoad()中不起作用)

开始和停止听写 UITextInput 现在可以正确调用所需的委托方法:

但是没有被调用的是

为什么?如何在听写结束时收到通知/调用方法?

0 投票
0 回答
776 浏览

ios - 在 UITextView 中使用听写时应用程序崩溃

在 UITextView 中使用听写时应用程序崩溃。在键盘中使用听写功能时,文本会自动保存,并且应用程序由于同样的原因而崩溃。正常情况:

当用户通过听写模式使用键盘输入文本时,文本将在 2 秒后自动保存。

当前情景

当用户通过听写模式尝试长语音文本时,文本正在自动保存,同时应用程序本身正在崩溃。

请找到堆栈跟踪

0 投票
2 回答
509 浏览

ios - WatchKit 选项只能听写?

我用:

这是 Apple 给出的文本输入示例。但是,在我的应用程序中,我希望用户只能选择口述文本。如果我将数组设置为 nil,则指示按钮不存在,但如果我不理会数组,则指示按钮会重新出现。有没有办法只通过听写进行文本输入?

更新:Apple 确实有文档说明,如果您将用户直接发送到听写,则不提供任何回复并将他们直接发送到那里。我是否正确地收集到当 initialPhrases 为 nil 时我什么都看不到的原因仅仅是由于模拟器限制?

0 投票
1 回答
1063 浏览

macos - 如何以编程方式开始听写?

我想将麦克风图标添加到我的应用程序中并开始听写。有没有办法在 Swift 中以编程方式开始听写?除了解析编辑菜单并获得正确的菜单项?

我做了这个解决方法并且它有效但是......:

0 投票
1 回答
59 浏览

audio - 实时声音路由...用另一个声音触发一个声音

我正在寻找一个能够从我的计算机中识别单个音频样本并重新路由它们以触发库中的 WAV 文件的程序。在我的项目中,它需要是实时的,因为延迟不是预期的结果。我尝试使用可以识别单词以触发打开文件的听写软件,这就是我想要去的方向,但我希望它不是单词而是声音并且它会实时发生。我不知道去哪里,只是在寻找一些指导。有人对我应该做什么有任何建议吗?

0 投票
2 回答
565 浏览

ios - Watchkit:通过 WKInterfaceController 单击文本听写

根据 Apple 的WKInterfaceController文档,您可以让用户以这种非常简单的方式来指示预设新界面控制器的文本:

})

如此所述。

我已经看到 Apple Watch 的 Amazon App 让您可以通过直接点击搜索图标来搜索产品

在此处输入图像描述

因此,您可以一步进入听写

在此处输入图像描述

通过WKInterfaceController方法,我们会得到不一样的东西

在此处输入图像描述

哪个 Apple 的 API Amazon 应用程序正在使用这种方式启用听写?

(更新)我刚刚发现它非常简单,如此处所述

所以我出来的最终解决方案是这个