3

如何编码语音识别引擎(使用 Microsoft Speech SDK)来“收听”视频文件并将检测结果保存到文件中?

4

1 回答 1

2

这与这个问题非常相似,并且有一个非常相似的答案。您需要分离出音频部分,将其转换为 WAV 格式,并将其发送到 inproc 识别器。

但是,它存在我之前描述的相同问题(需要训练,假设单一声音,并假设麦克风靠近扬声器)。如果是这种情况,那么您可能会得到相当好的结果。如果不是这种情况(即,您正在尝试转录电视节目,或者更糟糕的是,某种摄像机音频),那么结果可能不会令人满意。

于 2009-11-10T23:18:22.677 回答