0

我正在创建一个应用程序,它将为键盘上的每个字母预先录制用户的声音,并且当应用程序运行时,如果用户呼出“5”,则系统类型 5,任何应用程序都能够接受输入那时。我是 .NET 的人,正在冒险进入 XCode。

我做了一些研究,我很确定使用 AV Foundation 来录制音频。问题是如何在 OSX 中使用语音识别并使用它来识别键盘上的特定键......非常感谢任何反馈,即使它可能是我应该采取的解决这个项目的方法的一般建议!

提前致谢 :) !

4

1 回答 1

1

我先说清楚。我以前从未这样做过,但我对它是如何完成的有一个大致的了解。您需要将音频文件绑定到某个数字/键。每当用户对着麦克风讲话时,您都会录制他们的声音并将其上传到服务器,服务器会将用户的音频文件与用户制作的预录音频文件进行比较。

这是一个关于音频指纹识别的 SO Question。

如何以编程方式比较 2 个音频文件?

您可以比较 PHP/Python 中的音频文件,并让它返回一个值。例如。如果音频文件 a.mp3(在服务器上)与用户刚刚录制的 newRecorded.mp3 匹配,则返回 a.mp3,然后剥离 .mp3 并保留密钥。

至于记录句子和命令,你也许可以这样做。我将继续对此进行更多研究,并尽我所能帮助您。

希望这能给你一个更好的想法和更简单的做事方式。

还有这个 https://developer.apple.com/library/mac/documentation/cocoa/reference/ApplicationKit/Classes/NSSpeechRecognizer_Class/Reference/Reference.html

https://developer.apple.com/library/mac/documentation/cocoa/conceptual/speech/Articles/RecognizeSpeech.html#//apple_ref/doc/uid/20002081-BCIHEBFH

这可能真的很有帮助,并且会使用内置的语音识别。

于 2013-11-10T17:02:05.687 回答