c++ - 如何在视频文件中使用语音识别？

问问题 2009-11-09T12:17:04.400

517 次

3

如何编码语音识别引擎（使用 Microsoft Speech SDK）来“收听”视频文件并将检测结果保存到文件中？

1 回答 1

2

这与这个问题非常相似，并且有一个非常相似的答案。您需要分离出音频部分，将其转换为 WAV 格式，并将其发送到 inproc 识别器。

但是，它存在我之前描述的相同问题（需要训练，假设单一声音，并假设麦克风靠近扬声器）。如果是这种情况，那么您可能会得到相当好的结果。如果不是这种情况（即，您正在尝试转录电视节目，或者更糟糕的是，某种摄像机音频），那么结果可能不会令人满意。

于 2009-11-10T23:18:22.677 回答