14

我想将语音录音与已知文本同步。是否有可以促进这一点的语音到文本/自然语言处理库?我想我想检测单词边界并从字典中计算候选匹配。我在 SO 上发现的大多数问题都与书面语言有关。

需要但不是必需的:

  • 开源
  • 开箱即用地兼容美式英语
  • 跨平台
  • 详细记录

编辑:我意识到这是一个非常广泛,甚至是幼稚的问题,所以提前感谢您的指导。

到目前为止我发现了什么:

  • OpenEars(iOS Sphinx/Flite 包装器)
4

1 回答 1

12

强制对齐

听起来您想在音频和已知文本之间进行强制对齐。

几乎所有研究/工业级语音识别系统都能够做到这一点,因为强制对齐是训练识别系统的重要组成部分,该数据在音频和转录之间没有电话级别对齐的数据。

对齐CMUSphinx

CMU 开源语音识别系统的Sphinx4-1.0 beta 5 版本现在包含一个演示,介绍如何在转录和长语音记录之间进行对齐。

于 2010-11-02T03:20:30.230 回答