1

所以我一直在 Windows 10 中使用 Microsoft Speech Recognition,进行培训练习,将文本口述到 Wordpad 中并进行更正,将单词添加到字典中等等。我想使用该软件来转录 .wav 文件。似乎可以使用 Windows Speech Recognition API 来做到这一点,但这似乎涉及创建和加载自己的语法文件,这向我表明这基本上会创建一个新的语音识别器,它使用相同的构建块但不同当我在开始菜单中单击“开始语音识别”时运行的程序。特别是,由于训练或配置的差异,它的表现会有所不同。

我错了吗?如果我不是,是否还有一种方法可以检索默认语音识别器使用的所有数据,以便我可以准确地重现它的行为?如果我需要使用自己的语法文件和单独的训练历史等创建一个单独的语音识别器来转录 .wav 文件,那么就这样吧,但我想更好地了解这里发生了什么。

4

1 回答 1

0

Woundify开源项目包含如何将 wav 文件转换为文本 (STT) 的示例。

于 2016-03-24T13:26:24.750 回答