20

我正在开发一个网站,我想帮助盲人通过语音使用它,所以我将使用:

  • 文字转语音,为用户提供一些可能性
  • Speech-to-text,允许用户使用她的声音来选择一个

我已经有一些文本到语音的 JavaScript 库(例如speak.js),但现在我需要一个好的语音到文本的库。为此目的有一些解决方案(如Speechapi),但它们使用 Java Applets 或 Flash,我只想依赖 JavaScript,以避免插件。

我正在尝试使用 x-webkit-speech 和 Google Chrome 进行 HTML5 的语音输入,效果很好,但是您需要单击一个图标(而且盲人不能很好地使用鼠标)。是否可以使用 x-webkit-speech 按键?你知道任何替代 API (JavaScript) 吗?

谢谢!

4

2 回答 2

4

是否可以使用 x-webkit-speech 按键?

根据这篇文章和这篇文章,您不能通过单击麦克风来覆盖讲话的开始。

x-webkit-speech 正在做的是使用 HTML5 的音频捕获功能,并将音频发送到 Google 的服务器进行处理,以 JSON 格式返回结果。这位博主对其进行了逆向工程。您可以开发一个 JavaScript 库来查找按键以开始在支持 HTML5 的浏览器上捕获音频并将其发送到 Google 的服务或您创建的服务。使用 Google 服务的缺点是它是一个不受支持的 API,并且随时可能更改。开发自己的服务的缺点是开发和维护成本可能很高。

你知道任何替代 API (JavaScript) 吗?

这篇文章和这篇文章列出了一些可用于语音识别的服务。我没有看到 Nuance 列出。您可以为此使用Dragon Mobile SDK。你可能想检查一下ISpeech

于 2012-06-29T17:40:06.963 回答
2

谷歌翻译是非常好的文本到语音引擎。我曾经用它读过一篇文章。例如你有一个文本:welcome to Stack overflow你可以这样调用

http://translate.google.com/translate_tts?ie=UTF-8&q=Welcome%20to%20stack%20overflow&tl=en&total=1&idx=0&textlen=23&prev=input

然后使用浏览器音频播放它

对于语音输入,您可以手动激活收听过程,请参阅此处 http://code.google.com/chrome/extensions/experimental.speechInput.html

于 2012-06-28T09:38:55.573 回答