1

是否可以将 NSSpeechRecognizer 与预先录制的音频文件一起使用,而不是直接麦克风输入?

或者是否有其他可用的 Objective-C/Cocoa 语音到文本框架?

补充

而不是在运行应用程序的机器上使用语音,可以使用外部设备(例如 iPhone)仅将录制的音频流发送到该桌面应用程序。然后,桌面 Cocoa 应用程序将使用分配的命令处理并执行它应该执行的任何操作。

谢谢。

4

1 回答 1

2

我看不到以编程方式切换输入的任何明显方法,尽管“语音识别”部分中的“语音”配套指南的第一段似乎暗示可以使用其他输入。不过,我认为这应该通过系统偏好设置。我猜它使用在那里选择的主要音频输入设备。

不过,我怀疑您正在寻找开放式语音识别,而 NSSpeechRecognizer 不是。如果您希望将任何预先录制的音频转换为文本(即,制作录音的副本),那么您对 ​​NSSpeechRecognizer 完全不走运,因为您必须为其提供一系列“命令”来收听。

从理论上讲,您可以将整个字典提供给它,但我认为这行不通,因为您通常必须给出清晰、不同的命令。我猜,如果你给它一堆东西来分析(实时),它的性能会受到影响。

您最好的选择是查看第三方开源解决方案。那里有一些通用包(没有专门针对 Cocoa/Objective-C 的包),但这提出了另一个问题:您在寻找什么样的识别?语音识别的两种主要形式(“训练”更准确,但对于不同的声音和录音环境不太灵活,而“开放”通常不太准确)。

如果您确切地说明您要完成的工作,那可能是最好的。

于 2009-11-02T20:34:53.713 回答