我用 C# 开发了一个应用程序,它尝试使用 Skype ActiveX 和 Microsoft 的语音识别引擎识别 pc 到陆地电话呼叫中的短语,并通过 tcp/ip 端口重定向呼叫。
在电话里,一台机器播放一段录音,所以声音很清晰。但既不System.Speech
也Microsoft.Speech
不能识别任何有用的东西。
它已经为语法加载了预期的选择,但什么也没有。如果我说话,我必须说一个词,等到它认出这个词,然后再说下一个词,这样就可以了。
问题是,我该如何改进呢?或者您知道可以在实时对话中做得更好的 ASR?