17

我正在研究网络语音识别。

我发现谷歌向开发者提供了一个调用“谷歌语音API V2”的API。但我注意到每天使用它都有限制。

之后我发现有一个原生的WEB Speech API也可以实现语音识别。它只适用于谷歌浏览器和歌剧:

http://caniuse.com/#feat=speech-recognition

那么 1. Google Speech API 和 Web Speech API 有什么不同?他们有什么关系吗?

  1. 语音识别结果 json 是从谷歌返回的。谷歌语音api会比网络语音api更准确吗?

谢谢你。

4

2 回答 2

21

Web Speech API是 W3C 支持的规范,它允许浏览器供应商提供他们选择的语音识别引擎(无论是本地的还是基于云的),它支持您可以直接从浏览器使用的 API,而不必担心 API 限制和类似。你可以想象,Apple 可能会通过 Siri 来实现这一点,而微软可能会通过 Cortana 来实现。同样,浏览器供应商可以选择在操作系统中使用内置的听写软件,但这似乎不是目前的趋势。如果您尝试在浏览器中执行简单的语音合成(例如语音命令),这可能是最佳途径,尤其是随着采用率的增长。

Google Speech API是一种基于云的解决方案,允许您在浏览器之外使用 Google 的语音软件。它还提供更广泛的语言支持,并且可以转录更长的音频文件。如果您有 20 分钟的录音要转录,这将是您的选择。在撰写本文时,Google 对这项服务的第一个小时后记录的每 15 秒收费 0.006 美元。

于 2016-10-07T20:56:23.863 回答
1

Web API 是基于 REST 的 API,具有 API 密钥身份验证,尤其适用于需要简单功能集的网页。

而 Google Speech API 基本上是一个具有各种身份验证方法的 gRPC API。使用 gRPC 时有很多功能可用,例如身份验证、更快的调用和流式传输!!!

于 2018-11-10T19:33:13.713 回答