我想为孩子们开发一些基于网络的互动活动,我想使用语音识别作为一种输入。我的问题不在于如何在浏览器中录制声音,许多其他问题已经解决了这个问题。
我想知道的是是否存在某种免费的在线服务,我可以通过专用 API 访问来进行语音识别位?我的想法是录制声音并将其发送到服务器,这样我就不必为语音识别部分设置自己的专用服务器。例如,这就是 Siri 的工作方式。我认为 Apple 不提供对其语音识别引擎的免费访问(至少不是我发现的),但也许其他公司提供?
我想为孩子们开发一些基于网络的互动活动,我想使用语音识别作为一种输入。我的问题不在于如何在浏览器中录制声音,许多其他问题已经解决了这个问题。
我想知道的是是否存在某种免费的在线服务,我可以通过专用 API 访问来进行语音识别位?我的想法是录制声音并将其发送到服务器,这样我就不必为语音识别部分设置自己的专用服务器。例如,这就是 Siri 的工作方式。我认为 Apple 不提供对其语音识别引擎的免费访问(至少不是我发现的),但也许其他公司提供?
谷歌推出了一种新的 API,称为网络语音 API。看看https://www.google.com/intl/en/chrome/demos/speech.html
我也没有找到太多。谷歌有一篇论文谈到了在巨大的数据集上训练 LSTM 网络以建立儿童和成人的词汇表,还有Pullstring声称有针对儿童的语音识别引擎,但说到 API,我没有找到任何内容。我很感激对此有任何进一步的研究结论。