我正在创建一个应用程序,它将为键盘上的每个字母预先录制用户的声音,并且当应用程序运行时,如果用户呼出“5”,则系统类型 5,任何应用程序都能够接受输入那时。我是 .NET 的人,正在冒险进入 XCode。
我做了一些研究,我很确定使用 AV Foundation 来录制音频。问题是如何在 OSX 中使用语音识别并使用它来识别键盘上的特定键......非常感谢任何反馈,即使它可能是我应该采取的解决这个项目的方法的一般建议!
提前致谢 :) !
我正在创建一个应用程序,它将为键盘上的每个字母预先录制用户的声音,并且当应用程序运行时,如果用户呼出“5”,则系统类型 5,任何应用程序都能够接受输入那时。我是 .NET 的人,正在冒险进入 XCode。
我做了一些研究,我很确定使用 AV Foundation 来录制音频。问题是如何在 OSX 中使用语音识别并使用它来识别键盘上的特定键......非常感谢任何反馈,即使它可能是我应该采取的解决这个项目的方法的一般建议!
提前致谢 :) !
我先说清楚。我以前从未这样做过,但我对它是如何完成的有一个大致的了解。您需要将音频文件绑定到某个数字/键。每当用户对着麦克风讲话时,您都会录制他们的声音并将其上传到服务器,服务器会将用户的音频文件与用户制作的预录音频文件进行比较。
这是一个关于音频指纹识别的 SO Question。
您可以比较 PHP/Python 中的音频文件,并让它返回一个值。例如。如果音频文件 a.mp3(在服务器上)与用户刚刚录制的 newRecorded.mp3 匹配,则返回 a.mp3,然后剥离 .mp3 并保留密钥。
至于记录句子和命令,你也许可以这样做。我将继续对此进行更多研究,并尽我所能帮助您。
希望这能给你一个更好的想法和更简单的做事方式。
和
这可能真的很有帮助,并且会使用内置的语音识别。