ios - 从录制的文件中识别语音

Question

我一直在研究几个 iOS 语音识别框架，发现很难完成我认为非常简单的事情。

我有一个应用程序可以让人们录制他们的声音。录制完成后，他们可以选择创建文本版本。

查看那里的服务（即 Nuance）最需要您使用麦克风。OpenEars 允许您这样做，但字典非常有限，因为它是一个离线解决方案（他们推荐 300 或更少的单词）。

该应用程序还发生了一些其他事情，这使得从当前的录制方法切换起来非常没有吸引力。对于它的价值，我使用的是 Amazing Audio Engine 框架。

任何人对框架有任何其他建议。或者有没有办法用 Nuance 深入挖掘来转录一个录制的文件？

感谢您的时间。

score 1 · Accepted Answer

对于服务，您可以使用一些基于云的托管语音识别服务。您只需将音频文件发布到他们的 URL 并接收回文本。他们中的大多数人对词汇没有任何限制。您当然可以选择任何您喜欢的录制方式。

请参阅此处：服务器端语音识别。他们中的许多人还提供免费试用。

1 回答 1