问题标签 [speech-recognition-api]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
2853 浏览

ios - 我们可以使用 Sirikit 进行语音识别吗

我已经在我的应用程序中使用Nuance Dragon SDK实现了语音识别,用于语音到文本的转换。我也尝试过Open Ears,但无法正常工作。转换完成后,我使用该文本作为命令来触发我的应用程序中的操作。

我想知道是否可以在应用程序中使用Sirikit 。在查看WWDC16 Sirikit Introduction时,我无法理解它。可能是我对意图的解释不清楚,但据我所知,没有自定义意图来触发应用程序内部的某些操作。

另外,sirikit 是否也可用于目标 C 或仅适用于 Swift?

0 投票
1 回答
127 浏览

python - 在 Python 和 Text to Speech 上探索网站的源代码

我是 python 和这个论坛的新手。我目前正在使用 PyCharm,并使用它来制作一个简单的代码,在屏幕上打印网站的源代码。我看了一个视频,代码是这样的:

现在我想从一个网站的源代码中读取一行,就像一个固定的确定行,我应该怎么做?

另外,如何pyttsx在 PyCharm 中的 Windows 上使用。我需要一个用于 python 的文本到语音引擎。

有什么方法可以在 python 上使用语音识别引擎。我的意思是像谷歌一样在线还是离线?

0 投票
3 回答
3854 浏览

ios - 如何使 iOS 语音转文本持久化

我正在对一种新的潜在产品进行初步研究。该产品的一部分要求 iPhone 和 iPad 上的 Speech-To-Text 保持打开状态,直到用户将其关闭。在我自己使用它时,我注意到它要么在 30 秒左右后自动关闭,无论用户是否停止说话,要么在说话者说出一定数量的可疑词后关闭。在任何情况下,该产品都要求它始终保持开启状态,直到明确告知停止。以前有人用过这个吗?是的,我已经尝试了很好的搜索,我似乎找不到任何实质内容,尤其是任何以正确语言编写的内容。谢谢朋友!

0 投票
1 回答
919 浏览

ios - 如何强制 iOS Speech API 只读数字并将“一”识别为“1”

我想使用iOS Speech API来识别数学表达式。它适用于诸如two plus four times three- 将其读取为2+4*3,但是当我以 1 开始表达式时,它总是将其读取为“一”。当“一”在表达式的中间时,它按预期工作。

我发现当我将SFSpeechAudioBufferRecognitionRequest属性设置taskHint.search显示实时结果时,它首先将 1 正确识别为“1”,但最后将其更改为“One”

有没有办法将其配置为仅识别数字?或者只是强制将“一”读为“1”?或者修复它的唯一方法是自己格式化结果字符串?

0 投票
0 回答
821 浏览

swift4 - 当应用程序处于后台模式(手机锁定)时,Apple 的 SFSpeechRecognition 出错

我正在尝试使用 Apple 的 SFSpeechRecognition(xcode 9、ios11、swift 4)。以下代码使用计时器启动新的语音识别请求。我有背景功能,已授予麦克风使用权限和已授予语音识别权限。如果手机已解锁,一切都会按预期进行。但是当手机被锁定时,我收到以下错误:

2018-02-20 22:24:47.522562-0500 语音识别演示[3505:1234188] [实用程序] + [AFAggregator logDictationFailedWithError:] 错误域=kAFAssistantErrorDomain 代码=1700“(空)”

根据此链接,当应用程序处于后台模式时,语音识别似乎不起作用,但此信息已过时。我希望有人解决了这个问题或找到了解决方法。

有没有人解决了这个问题或者任何人都可以提出一些尝试?我的替代方法是为我的应用程序要求 Apple Watch,我真的很想避免这种情况......

0 投票
0 回答
323 浏览

android - 为什么“匹配”选项不适用于 cordova-plugin-speechrecognition?

问题:在 Android 应用程序中使用“用于语音识别的 Cordova 插件startListening()”,该函数几乎总是返回5 个匹配项,尽管设置了matches: 1.

  • matches 定义为:{Number} 返回匹配数(默认5

例如:

  • 说话:“怎么了”
  • 返回:“whatsup,whatsup,watsup,wat's up,what sup”

问题:如何限制输出只返回一个值/最佳匹配?

示例代码来说明我如何设置matches选项:

注意:修改其他选项,就像prompt工作正常,但修改matches什么都不做。

0 投票
1 回答
146 浏览

c# - Twilio 语音识别 C# 包解析缺少属性

我想使用 Twilio TwiML.Gather 进行语音识别,而我当前的版本缺少“输入”和“提示”(以及其他几个)属性。我想知道是否有解决这些问题的新软件包。如果没有,我该如何手动添加它们?

0 投票
2 回答
512 浏览

javascript - 为什么当我连接到 VPN 时 html5 SpeechRecognition API 不起作用?

我正在使用 HTML5 SpeechRecognition API (Chrome) 制作一个用于我的工作的应用程序,它运行良好,直到我连接到 VPN。当然,它不会将此语音数据发送到远程源。我所有的代码都在本地提供。我使用本地服务器,因此 ES6 导入功能将起作用。为什么连接公司 VPN 时无法使用 API?

0 投票
1 回答
82 浏览

c# - UWP 语音识别主题约束属性 topicHint

当使用 SpeechRecognitionTopicConstraint 类声明新约束时,我需要以这种方式指定场景和上下文(topicHint)。

或者

或者

根据场景类型。

我的怀疑是基于 topicHint 因为在网上我看到了不同的术语(例如“听写”、“电话号码”、“人名”、“网络搜索”、“地址”),但我没有找到关于哪些术语的信息可用以及它们在代码中的实际功能。

0 投票
2 回答
8231 浏览

python - 使用 WAV 文件在 python 中语音到文本

我尝试将语音转换为 WAV 文件,但我被困在这里。很多教程都给出了相同的代码,但它对我不起作用。这里是:

“hello_world.wav”文件与代码位于同一目录中。我没有任何错误。控制台:

帮助?:)

(对不起,如果我的英语不好)