44

如何获取 MP3 并将语音转换为文本?

我有一些会议记录和会议记录(录音中只有一个声音,这是我的声音)。我认为使用语音转文本工具而不是简单地手动转录会更容易且在智力上很有趣。我知道有一些技术,特别是对于使用 Asterisk 和 Podcast 的 VoIP 应用程序,但它们是什么以及如何使用它们?

4

4 回答 4

31

开源:CMU Sphinx

共享软件: http ://www.e-speaking.com/ (Windows)

广告: Dragon NaturallySpeaking (Windows)

于 2009-01-29T14:02:11.817 回答
5

.NET 可以使用它的 System.Speech 命名空间来做到这一点。

您必须先转换为 .wav 或从麦克风实时捕获音频。

可以在此处找到有关实施的详细信息: 使用 .NET 转录音频

于 2012-03-23T20:24:33.713 回答
4

Dragon NaturallySpeaking似乎支持 MP3 输入。

如果你想要一个开源版本(我认为有一些基于这个的 Asterisk 集成项目)。

于 2009-01-29T13:56:52.217 回答
3

聚会迟到了,所以回答更多以备将来参考。

该领域的进步 + Mozilla 的思维方式和议程导致了这两个项目的实现:

后者有一个 12GB 的数据集供下载。据我了解,前者允许使用您自己的音频文件训练模型

于 2017-11-30T13:16:12.047 回答