我一直在研究几个 iOS 语音识别框架,发现很难完成我认为非常简单的事情。
我有一个应用程序可以让人们录制他们的声音。录制完成后,他们可以选择创建文本版本。
查看那里的服务(即 Nuance)最需要您使用麦克风。OpenEars 允许您这样做,但字典非常有限,因为它是一个离线解决方案(他们推荐 300 或更少的单词)。
该应用程序还发生了一些其他事情,这使得从当前的录制方法切换起来非常没有吸引力。对于它的价值,我使用的是 Amazing Audio Engine 框架。
任何人对框架有任何其他建议。或者有没有办法用 Nuance 深入挖掘来转录一个录制的文件?
感谢您的时间。