cocoa - 使用 NSSpeechRecognizer 或替代音频文件而不是麦克风输入？

Question

是否可以将 NSSpeechRecognizer 与预先录制的音频文件一起使用，而不是直接麦克风输入？

或者是否有其他可用的 Objective-C/Cocoa 语音到文本框架？

补充：

而不是在运行应用程序的机器上使用语音，可以使用外部设备（例如 iPhone）仅将录制的音频流发送到该桌面应用程序。然后，桌面 Cocoa 应用程序将使用分配的命令处理并执行它应该执行的任何操作。

谢谢。

score 2 · Accepted Answer

我看不到以编程方式切换输入的任何明显方法，尽管“语音识别”部分中的“语音”配套指南的第一段似乎暗示可以使用其他输入。不过，我认为这应该通过系统偏好设置。我猜它使用在那里选择的主要音频输入设备。

不过，我怀疑您正在寻找开放式语音识别，而 NSSpeechRecognizer 不是。如果您希望将任何预先录制的音频转换为文本（即，制作录音的副本），那么您对 NSSpeechRecognizer 完全不走运，因为您必须为其提供一系列“命令”来收听。

从理论上讲，您可以将整个字典提供给它，但我认为这行不通，因为您通常必须给出清晰、不同的命令。我猜，如果你给它一堆东西来分析（实时），它的性能会受到影响。

您最好的选择是查看第三方开源解决方案。那里有一些通用包（没有专门针对 Cocoa/Objective-C 的包），但这提出了另一个问题：您在寻找什么样的识别？语音识别的两种主要形式（“训练”更准确，但对于不同的声音和录音环境不太灵活，而“开放”通常不太准确）。

如果您确切地说明您要完成的工作，那可能是最好的。

1 回答 1