我最近正在使用 CMU 的 sphinx4 进行转录并最终强制对齐,即将音频与其转录对齐。
我找到了一个名为AutoCap的项目,它基本上完成了我想要开发的工作。所以,我安装了它,但它没有用。我尝试调整它,但我得到的只是不正确的时间戳。
所以,我想到了使用 sphinx4 并自己尝试一下。我使用 Sphinx 的 Transcriber.jar 文件成功转录了一个 wav 文件。但我无法让它适用于非数字数据的音频。自述文件页面指出“想要转录非数字数据的人应修改 config.xml 文件以使用正确的语法、语言模型和语言学家来执行此操作”。
那么,任何人都可以为我提供一些帮助:
- AutoCap
- 使用 Sphinx4 转录非数字数据
- 强制对齐
谢谢。