我开发了一个应用程序,它使用SAPI 5.1
.
由于准确性太弱,我决定创建自己的语法,我创建了自己的语法,它只能识别从 1 到 10 的数字。
我又一次在准确性上失败了。所以我深入研究了语法文件。我浏览了用于发音的 Lexion File。所以我的问题是
词典文件会提高准确性吗?这样我就可以在 Lexicon 文件中使用数字一到十的发音,然后使用它。
我需要一个关于如何创建词典文件的模板。
我开发了一个应用程序,它使用SAPI 5.1
.
由于准确性太弱,我决定创建自己的语法,我创建了自己的语法,它只能识别从 1 到 10 的数字。
我又一次在准确性上失败了。所以我深入研究了语法文件。我浏览了用于发音的 Lexion File。所以我的问题是
词典文件会提高准确性吗?这样我就可以在 Lexicon 文件中使用数字一到十的发音,然后使用它。
我需要一个关于如何创建词典文件的模板。
如果您的语音识别准确率较弱,可能是以下任一原因:
训练数据不足 - 请注意,创建依赖于说话者的语音识别系统(仅与一个说话者相关联)需要每个单词的大量单元(在您的情况下为 1 到 10 个)。需要单独的单元来训练初始模型,然后可能需要嵌入训练数据来进一步改进模型。
与说话者无关的语音识别模型将需要更多的数据。
测试数据和训练数据之间存在不匹配。如果模型是使用无噪音数据或带有口音的数据创建的,则在使用噪音很大或口音不同的数据进行测试时,可能很难获得良好的结果。
但是更多关于你正在尝试构建的语音识别系统的细节会更好。
更新 1:由于您在评论中提到您正在使用 Microsoft 语音 SDK,因此这里是在声音/口音上训练语音 SDK的指南。只需按照说明进行操作,您就可以开始上路了。