在应用程序中,我必须比较以前本地存储的语音命令的实时录音,如果它匹配(不仅是文本,还包括识别出的人的声音),然后执行必要的操作。
1 匹配来自同一个人的语音命令。
2-匹配命令的文本。
我应用了很多方法,但没有一个按我的预期工作。
首先: 使用OpenEars、 SpeechKit等语音转文本库,但这些库仅转换语音中的文本。
结果:如我所愿失败
二:(音频指纹)
acrcloud 库:在这个库中,我记录了一个命令并将该 mp3 文件存储在 acrcloud 服务器上,并与现场录音(由我说)匹配,但当我播放相同的录音(我的声音录制的 MP3 文件)时,它是上传到 acrcloud 服务器然后匹配。 结果:如我所愿失败
API.AI:在这个库中,就像语音到文本一样,我在他的服务器上存储了一些文本命令,然后任何人说出相同的命令,结果都会成功。 结果:如我所愿失败
请建议我如何解决 iOS 应用程序的这个问题