vb.net - SpeechRecognitionEngine Spoken 和 Recorded 不匹配

Question

我SpeechRecognitionEngine用来识别用户所说的信息。该方法将在客户端的计算机上运行，它工作得很好，并且几乎可以像我想要的那样识别文本。所以我很高兴。

但是，我希望能够在我的服务器上对波形文件进行一些处理。现在我正在我的本地机器上进行测试，当我SetInputToWaveFile在识别器上使用该方法时，并将相同的音频剪辑传回（引擎最初记录的那个）它没有给出任何接近原始匹配（或替代）的东西.

例如：用户说话，识别器返回短语：“Hello how are you today”，有 10 个替代词。Wave文件被保存，然后通过使用SetInputToWaveFile（或SetInputToAudioStream）传入。识别器将返回一个与口语文本完全不同的短语（通常是一个单词），例如“Moon”和零替换。

通常，这样做时，识别器不会引发RecognizeCompleted事件。然而，它有时会引发SpeechHypothesized事件，有时会AudioSignalProblem发生。

不应该将从识别器结果中捕获的音频剪辑传递回相同的识别器，返回相同的匹配项？

原来的：

Private _recognizer As New SpeechRecognitionEngine(New CultureInfo("en-US"))

_recognizer.UnloadAllGrammars()
_recognizer.LoadGrammar(New DictationGrammar())
_recognizer.SetInputToDefaultAudioDevice()
_recognizer.InitialSilenceTimeout = TimeSpan.FromSeconds(2)
_recognizer.MaxAlternates = 10
_recognizer.BabbleTimeout = TimeSpan.FromSeconds(1)       
Dim result As RecognitionResult = _recognizer.Recognize()
Dim aud As RecognizedAudio = _result.Audio 'This is the audio that gets saved
aud.WriteToWaveStream("mypath")

（我已经删除了其中的一些逻辑代码，它们会提取结果并进行一些处理）

现在尝试从音频文件中提取：

_recognizer.SetInputToWaveFile("mypath")

'Doesn't work either
'_recognizer.SetInputToAudioStream(File.OpenRead("mypath"), New SpeechAudioFormatInfo(44100, AudioBitsPerSample.Sixteen, AudioChannel.Mono)) 

Dim result2 As RecognitionResult = _recognizer.Recognize()

result 和 result2 的识别/匹配甚至不接近。

score 0 · Accepted Answer

我手动设置了语音音频格式信息，现在可以完美运行了。

_recognizer.SetInputToAudioStream(File.OpenRead("mypath"), New SpeechAudioFormatInfo(EncodingFormat.Pcm, 16000, 16, 1, 32000, 2, Nothing))

vb.net - SpeechRecognitionEngine Spoken 和 Recorded 不匹配

1 回答 1

Related

Reference