1

我一直在研究几个 iOS 语音识别框架,发现很难完成我认为非常简单的事情。

我有一个应用程序可以让人们录制他们的声音。录制完成后,他们可以选择创建文本版本。

查看那里的服务(即 Nuance)最需要您使用麦克风。OpenEars 允许您这样做,但字典非常有限,因为它是一个离线解决方案(他们推荐 300 或更少的单词)。

该应用程序还发生了一些其他事情,这使得从当前的录制方法切换起来非常没有吸引力。对于它的价值,我使用的是 Amazing Audio Engine 框架。

任何人对框架有任何其他建议。或者有没有办法用 Nuance 深入挖掘来转录一个录制的文件?

感谢您的时间。

4

1 回答 1

1

对于服务,您可以使用一些基于云的托管语音识别服务。您只需将音频文件发布到他们的 URL 并接收回文本。他们中的大多数人对词汇没有任何限制。您当然可以选择任何您喜欢的录制方式。

请参阅此处:服务器端语音识别。他们中的许多人还提供免费试用。

于 2013-10-22T16:47:06.693 回答