1

我一直在寻找一种在线语音识别的方法,例如:非常类似于谷歌语音搜索,不需要用户安装任何插件/软件/闪存。用户只需插入麦克风并说出一些内容即可识别文本。

我想到了这种方法,但不知道这是否正确。我构建了一个 dll,它可以获取输入音频流并从音频中输出可识别的 txt。我在 ASP.NET 参考中引用了这个 dll,并进一步考虑将音频文件从用户端上传到服务器,然后将其用作“识别器”dll。我不确定这种方法是否正确?我还有其他方法可以遵循吗?
主要的是我不能让用户为此实现安装任何东西或任何依赖项,例如 flash/silverlight 等。

4

1 回答 1

1

如果您可以指定您的用户使用 Chrome 11 或更高版本,您可以使用 Google 的 webkit 来启用您的应用程序的语音功能。这是一个关于如何使用 webkit 进行语音的链接这利用了HTML5中可用的音频输入功能。如果你看一下这个博客,它将解释它是如何工作的,因为作者对它进行了逆向工程。它从浏览器中的用户那里获取音频输入并将其发送到服务进行处理,并将结果作为 JSON 消息返回。正如您所建议的,您可以在服务器端构建自己的服务来模仿 Google 正在做的事情。构建可扩展的语音识别服务绝非易事。

于 2012-06-29T15:29:23.910 回答