如何让引擎成功识别语音文件(wav/mp3/etc..)中的短语?
例如,如果我将一个语音文件和一个书面文本的上下文放在同一个文件中,那么要让它识别语音文件中的书面文字。
我尝试使用 SpeechRecognitionEngine,但到目前为止没有成功。
我会很感激想法,因为这是我第一次处理语音识别技术。
我已经看到使用字典的语音到文本的示例,但我不确定它在这里如何有用。我正在考虑将所有语音文件转换为文本,然后简单地在该文本中查找特定的短语,但我认为这不是正确的方法。将例如 5hrs 语音转换为文本似乎没有意义.... 或者将特定短语用作“字典”并在语音文件中查找此项目。