我正在一个“网络应用程序”中大量使用输入语音字段,该应用程序注定每天有大约 2 千名用户使用。
我的理解是语音输入字段,至少在 Chrome 中(不确定 Firefox?)连接到 Google 语音服务器。
是否有任何可以达到的配额,之后服务将停止工作?
我正在一个“网络应用程序”中大量使用输入语音字段,该应用程序注定每天有大约 2 千名用户使用。
我的理解是语音输入字段,至少在 Chrome 中(不确定 Firefox?)连接到 Google 语音服务器。
是否有任何可以达到的配额,之后服务将停止工作?
每个音频流的长度都有时间限制——这是谷歌服务器的限制,似乎是 60 秒左右,尽管没有记录。
这个限制是完全合理的——你不能指望谷歌处理数小时的音频,因为该模型永远不会扩展。您应该以类似于 Siri 的方式处理该服务 - 启动识别会话,为其提供一小段音频流,处理这些结果,启动一个新会话。
不幸的是,由于网络语音识别工作仍在积极开发中,事情仍然非常不稳定,文档有限。我建议在 Chrome 浏览器邮件列表中四处挖掘,并在那里发布具体问题。我发现在谷歌从事这方面工作的人对具体问题非常敏感。
有关语音识别的最小演示以及对当前语音 API 问题的一些想法,您可能想查看此Web 语音识别教程
就像翻译 API 一样,有一个非官方的配额。如果您打算拥有来自同一 IP 的多个用户,那么您可能会偶尔被阻止。如果您正在开发任务关键型应用程序,则不应依赖 Google 服务。例如关于翻译 API 配额,请参阅
https://developers.google.com/translate/v2/pricing
参见例如