python - 有人熟悉微软语音识别 API 吗？

Question

我正在用 python 编写一些语音识别代码，我希望它能够打开微软语音识别系统，但我希望该系统忽略所有常规的 gui 界面命令。因此，如果我说出它可以识别的内容，它会忽略它并让我的程序处理它。

score 1 · Accepted Answer

我相信有一个名为pyspeech的 Python API ，它是围绕 Microsoft 语音 API 的包装器。请参阅pyspeech (python) - 转录 mp3 文件？一些可能有帮助的答案。

通常，使用 Microsoft 语音 API，当人们看到“常规 GUI 界面命令”时，这意味着他们已经实例化了一个共享识别器。您需要实例化一个 inproc 识别器。您可以通过在应用程序中实例化 SpeechRecognitionEngine() 来做到这一点。请参阅SpeechRecognitionEngine 类。我怀疑您正在实例化一个共享识别器 - SpeechRecognizer 类

几年前在http://msdn.microsoft.com/en-us/magazine/cc163663.aspx上发表了一篇关于 Microsoft Speech 的非常好的文章。这可能是迄今为止我发现的最好的介绍性文章。它有点过时了，但很有帮助。（AppendResultKeyValue 方法在 beta 之后被删除。）

这两个问题可能对您有一些其他有用的信息：

python - 有人熟悉微软语音识别 API 吗？

1 回答 1

Related

Reference