speech-recognition - 视频语音识别降噪

翻译自：https://stackoverflow.com/questions/19511387 2013-10-22T07:13:30.560

200 次

我正在寻找视频中的自动语音识别。我不是在寻找一个准确的“转录”，而是寻找一个可以准确识别某些特定关键词的系统。

我似乎面临的问题是非语音视频（例如常规电视录制），其中有一些背景噪音（人群欢呼，鼓掌等）或音乐。有没有我应该考虑的已知方法可能是“提取”人声，然后将其传递给像 sphinx 这样的语音识别器？我知道这可能是一个非常开放的问题，但我不是在这里寻找超高精度，至少一开始是这样。我已经看到一些商业系统在这方面做得不错。我正在寻找我应该开始寻找的地方。

我是这个领域的新手——所以任何帮助都会很棒。

speech-recognition - 视频语音识别降噪

0 回答 0

Related