25

我现在正在处理我的项目,并且即将为台式计算机构建一个类似 Siri 的应用程序。我在想 Google Speech API 对于语音识别是否可靠且准确?你能建议我在语音识别方面哪个语音 API 最准确吗?最好是免费的 API。谢谢你。

4

1 回答 1

37

虽然 Google 语音 API 是免费的,但它不是官方的公共 API。有些人对其进行了逆向工程,如本博客所述。如果您打算直接访问商业产品的 API,我不推荐它,因为他们可以在没有警告的情况下删除或更改它,从而破坏您的产品。这最近发生在使用Google Weather API的开发人员身上。如果您通过 Chrome 浏览器使用x-webkit-speech访问它另一方面,您可能是安全的,因为它受 Google 支持。谷歌的语音识别与许多更流行的商业解决方案一样。他们在其他项目中拥有丰富的经验,例如 Google Voice 和现已解散的 Google 411。他们有一些顶尖的语音科学家为他们工作。我能想到的唯一其他免费替代品是Sphinx,它是卡内基梅隆大学的一个开源项目。使用此解决方案的学习曲线陡峭,如果您希望将其设置为服务,则必须自己开发。 Nuance是语音识别市场的另一个大玩家(我相信这是 Siri 使用的),他们确实有提供语音识别即服务的解决方案。但它们很贵。

更新语言支持评论的答案

Windows 语音识别支持其他语言,大多数语音识别系统也是如此。但需要注意的是,您必须告诉系统要使用哪种语言,并且它必须支持相关语言。每个供应商都有一个它支持的语言列表,并且它们特定于一个地区。例如,供应商可能支持墨西哥西班牙语、美国西班牙语和西班牙西班牙语;它们都有略微不同的方言。但是语音识别引擎在每个用户的计时器上只能支持一种语言/方言。如果不首先请求将其更改为该语言,用户就无法对语音识别系统说多种语言。

2014 年 3 月 17 日更新

由于其他浏览器缺乏支持,x-webkit-speech 输入字段已被弃用。这将被Web Speech API取代,这是一个 javascript API。您可以在此处找到有关如何使用它的示例

于 2012-10-04T13:03:32.250 回答