我正在使用 Kinect + Microsoft.Speech 进行语音识别。
要获取输入音频流,必须执行以下操作
Stream kinectAudioStream = myKinect.AudioSource.Start();
并开始语音识别
speechRecognitionEngine.SetInputToAudioStream(kinectAudioStream, new SpeechAudioFormatInfo(...));
speechRecognitionEngine.RecognizeAsync(RecognizeMode.Multiple);
我的目标是实时可视化输入信号(如示波器)并同时进行语音识别。
我尝试了一些方法,例如在多个线程中将语音识别添加到 Microsoft“ AudioBasics-WPF C# Sample ”。它有效,但延迟非常非常非常糟糕。语音识别和可视化中断很多。
有没有办法提高性能?有人有想法吗?