我正在尝试安装语音识别引擎服务器端。(非商业首选,因为它只是为了实验)
这个想法是允许用户从网站上说些什么,然后他/她说的任何内容都会显示在屏幕上(作为文本)
我已经阅读了许多可用的软件,包括 Microsoft Speech、Sphinx、Julius 等,只是不确定哪一个的性能最好且最容易安装。通常我是否需要在我的主机上获得 root 权限才能执行此类操作?我现在正在使用常规的共享主机。
谢谢你,
三通
我正在尝试安装语音识别引擎服务器端。(非商业首选,因为它只是为了实验)
这个想法是允许用户从网站上说些什么,然后他/她说的任何内容都会显示在屏幕上(作为文本)
我已经阅读了许多可用的软件,包括 Microsoft Speech、Sphinx、Julius 等,只是不确定哪一个的性能最好且最容易安装。通常我是否需要在我的主机上获得 root 权限才能执行此类操作?我现在正在使用常规的共享主机。
谢谢你,
三通
一个小时前我已经回答了一个类似的问题。您可以使用任何 ASR 工具。两个开源的 htk/julius 和 sphinx 都可以工作。我使用 sphinx4 来做到这一点。如果仅用于您自己的用途,您可以使用共享托管计划,但对于许多用户,您将需要专用服务器。
您将需要 root 来安装许多必要的软件包。您还可以选择多种媒体来接收音频,例如 flash/silverlight/google gears/ 等。
我在 www.speechapi.com 上做了一些演示,可以完成一些简单的任务。一个小时内发布两个自我推销帖子。对不起!
我怀疑您将能够使用共享托管环境做任何事情。语音识别可能是相当 CPU 密集型的,共享主机环境显然是“共享的”,并且大多数主机不希望您窃取所有资源。