neural-network - 最佳开源语音识别 API 和引擎

问问题 2018-01-07T14:55:07.613

371 次

我正在为 PC 制作我的语音识别项目（在 Windows 8 上工作）和该领域的新项目。该项目应具有基本功能，如在电子邮件、记事本等中准确听写，并应响应 PC 的本地命令。

我正在为我的语音识别项目使用 sphinx4。我想知道，有没有比 cmu sphinx 更好的开源 API？我希望在准确性和大词汇量方面做得更好。kaldi（基于深度神经网络）比 cmu sphinx（基于 HMM）更好吗？我想知道哪个更好？

语音 API 和语音引擎有什么区别，作为开发人员，我需要什么来开发我的软件？

请帮助我对上述问题给出一个清晰的认识，如果可能的话，请提供一些语音识别开发人员或研究人员社区链接。

0 回答 0