0

我一直在对 PortAudio 和自然语言处理进行一些实验,我想知道是否有某种方法可以将两者结合起来。我想要的是一种服务,它可以从视频中获取音频(视频格式可以是最简单的),并在播放时将其解析为文本。我知道这对于 Android 来说相当简单,但我希望它可以在计算机或笔记本电脑上运行,如果可能的话,可以实时运行。一旦我在视频中通过声卡播放语音,我已经确定了我的映射,但是我对如何实现第一部分有点迷茫。我知道 Dragon,但我更愿意使用非专有的东西来进行实际的语音到文本解析。解析器不需要完美,我可以处理拼写错误和不规则的词形。有什么想法吗?

4

0 回答 0