问题标签 [webspeech-api]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
1317 浏览

javascript - Web Speech API“检测已知单词”

我正在开发一个可以检测某些关键词的应用程序。我一直在使用谷歌的网络语音。

我能够记录用户的声音并将其打印出来,但我希望能够检测到某些单词。

我似乎找不到这样做的方法。我发现了这个问题Detecting known words using the Web Speech API,但它链接到的答案中的站点已经消失。

任何人都可以对此有所了解吗?任何帮助都会很棒。干杯! 这是一个小提琴

0 投票
1 回答
2637 浏览

javascript - 使用 W3C Web Speech API 生成音频文件

是否可以使用 W3C Web Speech API 编写 Javascript 代码来生成带有语音给定文本的音频文件(wav、ogg 或 mp3)?我的意思是,我想做类似的事情:

但我希望用它生成的声音不是输出到扬声器而是输出到文件。

0 投票
0 回答
543 浏览

javascript - 语音识别听长

我需要你的帮助我不知道如何解决我的问题。我有用离子编写的应用程序,我使用 annyang 到语音识别来聆听用户所说的内容和响应。它在网络上工作得很好——使用离子服务,但是当我在安卓设备上运行它时,语音识别需要很长时间,从 30 秒到几分钟——我只说一个词,例如“商店”。

有什么办法可以减少这个时间?或者我可以设置任何超时吗?

我会很感激任何帮助。谢谢。

编辑:代码看起来像

Edit2:这是一样的,结果我必须等待 2 分钟

0 投票
0 回答
384 浏览

javascript - Web Speech API:通过一组词汇提高准确性

我可以通过为特定应用程序设置一些词汇来改进网络语音 api 吗?

0 投票
0 回答
149 浏览

javascript - SpeechSynthesis:Lang vs Voice

SpeechSynthesisUtterance界面提供了两个选项来设置使用的语音:voicelang

lang采用类似en-USor的语言代码es-ES

voice接受一个SpeechSynthesisVoice你从speechSynthesis.getVoices().

如果两者都未设置,则使用浏览器的默认值。如果lang未设置,则仅使用voice提供的。如果voice未设置,它会找到SpeechSynthesisVoice匹配的lang

如果两者都设置了,但播放的声音不同。lang设置似乎是最重要的因素。

我需要两个都设置吗?如果我只设置设置会出问题voice吗?

0 投票
1 回答
7490 浏览

javascript - SpeechRecognition 在 Firefox 中不起作用

我正在尝试测试firefox的 webspeech-api,但在控制台中遇到错误,提示ReferenceError: SpeechRecognition is not defined

我什至在 about:config 中启用media.webspeech.recognition.enablemedia.webspeech.synth.enabled标记。

有没有办法让SpeechRecognition在 Firefox 上工作?

0 投票
1 回答
725 浏览

webspeech-api - WebkitSpeechRecognition 架构

我知道 WebkitSpeechRecognition 仅在 chromium 浏览器上可用。但是我想知道它如何将语音转换为文本?

我试图从 Google Chrome 上的开发者控制台监控网络日志,但没有看到任何网络活动。我以为我会向 Google 发送 API 请求,但我真的没有。

我也找不到任何关于此的架构文件。

有人知道吗?

0 投票
2 回答
159 浏览

javascript - Google Web Speech API 中的奇怪行为

我正在使用 Google Chrome (55.0.2883.87) 使用 Google 的Web Speech API,我遇到了一些非常奇怪的行为。

当试图说出名字时,后跟一个数字(如John 4),它通常只是说出名字和数字,因为它应该- 但对于某些名字,它会将单词chapter放在名字和数字之间,所以Daniel 4变成Daniel Chapter 4.

我选择了一些随机名称并使用以下代码对其进行了测试:

msg变量在记录时不包括单词 chapterconsole.log()

在这 9 个名字中,名字JohnDaniel是用它们之间的单词说出的chapter

问题

为什么会发生这种情况,哪些标准决定了哪些名称会受到影响?

0 投票
3 回答
4319 浏览

google-chrome - Web 语音 API 在没有输入的情况下经过一段时间后停止收听

我正在使用网络语音 API,但是一旦一段时间(一分钟或两分钟)没有任何声音输入,它就会完全停止收听。我知道这一点,因为我让它将其解析的文本记录到控制台,但是,当我一两分钟不说话时,它就会停止这样做。

有没有什么办法解决这一问题?

0 投票
2 回答
2467 浏览

javascript - Web Speech API 中语法的效果

在 Web Speech API 的示例中,始终指定语法。例如,在MDN 的 color change example中,语法为:

但是,在实际使用 API 时(在 Chrome 54.0.2840.71 上),结果函数

  1. 有时返回不符合提供的语法的字符串
  2. 不提供描述语音的解析树

那么语法实际上是做什么的呢?我怎样才能获得这些行为中的任何一种(仅限于语法并查看解析树)?