speech-recognition - 服务器端语音转文本

Question

我正在尝试安装语音识别引擎服务器端。（非商业首选，因为它只是为了实验）

这个想法是允许用户从网站上说些什么，然后他/她说的任何内容都会显示在屏幕上（作为文本）

我已经阅读了许多可用的软件，包括 Microsoft Speech、Sphinx、Julius 等，只是不确定哪一个的性能最好且最容易安装。通常我是否需要在我的主机上获得 root 权限才能执行此类操作？我现在正在使用常规的共享主机。

谢谢你，
三通

score 1 · Accepted Answer

一个小时前我已经回答了一个类似的问题。您可以使用任何 ASR 工具。两个开源的 htk/julius 和 sphinx 都可以工作。我使用 sphinx4 来做到这一点。如果仅用于您自己的用途，您可以使用共享托管计划，但对于许多用户，您将需要专用服务器。

您将需要 root 来安装许多必要的软件包。您还可以选择多种媒体来接收音频，例如 flash/silverlight/google gears/ 等。

我在 www.speechapi.com 上做了一些演示，可以完成一些简单的任务。一个小时内发布两个自我推销帖子。对不起！

score 1 · Accepted Answer

我怀疑您将能够使用共享托管环境做任何事情。语音识别可能是相当 CPU 密集型的，共享主机环境显然是“共享的”，并且大多数主机不希望您窃取所有资源。

2 回答 2