1

我正在使用 Kinect + Microsoft.Speech 进行语音识别。

要获取输入音频流,必须执行以下操作

Stream kinectAudioStream = myKinect.AudioSource.Start();

并开始语音识别

speechRecognitionEngine.SetInputToAudioStream(kinectAudioStream, new   SpeechAudioFormatInfo(...));
speechRecognitionEngine.RecognizeAsync(RecognizeMode.Multiple);

我的目标是实时可视化输入信号(如示波器)并同时进行语音识别。

我尝试了一些方法,例如在多个线程中将语音识别添加到 Microsoft“ AudioBasics-WPF C# Sample ”。它有效,但延迟非常非常非常糟糕。语音识别和可视化中断很多。

有没有办法提高性能?有人有想法吗?

4

1 回答 1

0

好吧,你最好的选择是下拉到 Kinect DMO 并连接一个SmartTee过滤器,但这需要你用 C++ 编写,因为 KinectAudioSource 不会暴露过滤器本身。

于 2013-07-19T20:51:15.130 回答