我正在为 PC 制作我的语音识别项目(在 Windows 8 上工作)和该领域的新项目。该项目应具有基本功能,如在电子邮件、记事本等中准确听写,并应响应 PC 的本地命令。
我正在为我的语音识别项目使用 sphinx4。我想知道,有没有比 cmu sphinx 更好的开源 API?我希望在准确性和大词汇量方面做得更好。kaldi(基于深度神经网络)比 cmu sphinx(基于 HMM)更好吗?我想知道哪个更好?
语音 API 和语音引擎有什么区别,作为开发人员,我需要什么来开发我的软件?
请帮助我对上述问题给出一个清晰的认识,如果可能的话,请提供一些语音识别开发人员或研究人员社区链接。