javascript - 盲人的 JavaScript Speech-to-Text

Question

我正在开发一个网站，我想帮助盲人通过语音使用它，所以我将使用：

文字转语音，为用户提供一些可能性
Speech-to-text，允许用户使用她的声音来选择一个

我已经有一些文本到语音的 JavaScript 库（例如speak.js），但现在我需要一个好的语音到文本的库。为此目的有一些解决方案（如Speechapi），但它们使用 Java Applets 或 Flash，我只想依赖 JavaScript，以避免插件。

我正在尝试使用 x-webkit-speech 和 Google Chrome 进行 HTML5 的语音输入，效果很好，但是您需要单击一个图标（而且盲人不能很好地使用鼠标）。是否可以使用 x-webkit-speech 按键？你知道任何替代 API (JavaScript) 吗？

谢谢！

score 4 · Accepted Answer

是否可以使用 x-webkit-speech 按键？

根据这篇文章和这篇文章，您不能通过单击麦克风来覆盖讲话的开始。

x-webkit-speech 正在做的是使用 HTML5 的音频捕获功能，并将音频发送到 Google 的服务器进行处理，以 JSON 格式返回结果。这位博主对其进行了逆向工程。您可以开发一个 JavaScript 库来查找按键以开始在支持 HTML5 的浏览器上捕获音频并将其发送到 Google 的服务或您创建的服务。使用 Google 服务的缺点是它是一个不受支持的 API，并且随时可能更改。开发自己的服务的缺点是开发和维护成本可能很高。

你知道任何替代 API (JavaScript) 吗？

这篇文章和这篇文章列出了一些可用于语音识别的服务。我没有看到 Nuance 列出。您可以为此使用Dragon Mobile SDK。你可能想检查一下ISpeech。

score 2 · Accepted Answer

谷歌翻译是非常好的文本到语音引擎。我曾经用它读过一篇文章。例如你有一个文本：welcome to Stack overflow你可以这样调用

http://translate.google.com/translate_tts?ie=UTF-8&q=Welcome%20to%20stack%20overflow&tl=en&total=1&idx=0&textlen=23&prev=input

然后使用浏览器音频播放它

对于语音输入，您可以手动激活收听过程，请参阅此处 http://code.google.com/chrome/extensions/experimental.speechInput.html

javascript - 盲人的 JavaScript Speech-to-Text

2 回答 2

Related

Reference