1

我用 C# 开发了一个应用程序,它尝试使用 Skype ActiveX 和 Microsoft 的语音识别引擎识别 pc 到陆地电话呼叫中的短语,并通过 tcp/ip 端口重定向呼叫。

在电话里,一台机器播放一段录音,所以声音很清晰。但既不System.SpeechMicrosoft.Speech不能识别任何有用的东西。

它已经为语法加载了预期的选择,但什么也没有。如果我说话,我必须说一个词,等到它认出这个词,然后再说下一个词,这样就可以了。

问题是,我该如何改进呢?或者您知道可以在实时对话中做得更好的 ASR?

4

1 回答 1

3

最直接的方法是使用专门为任务设计的工具,而不是使用skype/activex 的手工解决方案。

有特殊的软件可以将电话连接到可操作的东西。他们中有一些:

星号

自由开关

所有此类系统都通过 MRCP 协议提供语音识别和交互式语音响应功能。设置识别的最简单方法是使用CMUSphinx 工具包

您可以在此处此处阅读有关将 CMUSphinx 集成到 IVR 系统的更多信息

如果您喜欢快速开始,有很酷的 SAAS 解决方案,让您只需点击几下即可构建电话应用程序。例如Voxeo

于 2013-01-04T14:57:52.143 回答