-1

我正在用 python 编写一些语音识别代码,我希望它能够打开微软语音识别系统,但我希望该系统忽略所有常规的 gui 界面命令。因此,如果我说出它可以识别的内容,它会忽略它并让我的程序处理它。

4

1 回答 1

1

我相信有一个名为pyspeech的 Python API ,它是围绕 Microsoft 语音 API 的包装器。请参阅pyspeech (python) - 转录 mp3 文件?一些可能有帮助的答案。

通常,使用 Microsoft 语音 API,当人们看到“常规 GUI 界面命令”时,这意味着他们已经实例化了一个共享识别器。您需要实例化一个 inproc 识别器。您可以通过在应用程序中实例化 SpeechRecognitionEngine() 来做到这一点。请参阅SpeechRecognitionEngine 类。我怀疑您正在实例化一个共享识别器 - SpeechRecognizer 类

几年前在http://msdn.microsoft.com/en-us/magazine/cc163663.aspx上发表了一篇关于 Microsoft Speech 的非常好的文章。这可能是迄今为止我发现的最好的介绍性文章。它有点过时了,但很有帮助。(AppendResultKeyValue 方法在 beta 之后被删除。) 

这两个问题可能对您有一些其他有用的信息:

  1. System.Speech.Recognition 和 Microsoft.Speech.Recognition 有什么区别?
  2. SAPI 和 Windows 7 问题
于 2012-01-25T15:12:07.757 回答