java - 用我自己的字典创建 CMUSphinx 语言模型后的下一步是什么？

Question

我已经为一个软件创建了自己的 CMUSphinx 阿拉伯语语言模型，该软件将聆听用户并使用我自己手动完成的字典应用命令，将“arpa”语言模型类型转换为“dmp”语言模型使用命令sphinx_lm_convert -i ar.lm -o ar.lm.dmp，所以这里是我到目前为止的文件：

然后我记录了自己说每个单词的过程，每个单词都有自己的 .wav 文件，它们都在一个文件夹中，与 .dic、.txt、.lm 所在的文件夹分开。

说适应现有的声学模型是建立语言模型之后的下一步，不是训练语言模型吗？

如果是培训，我有所有需要的文件，除了：

这两个文件里面应该有什么？

谢谢

score 1 · Accepted Answer

声学模型训练教程中描述了声学模型训练的过程。

如果要将任何自定义形式的现有转录转换为所需格式，则需要在文本编辑器中或使用脚本手动创建 fileid 和转录文件。

Fileids 必须列出文件名，转录文件必须以特殊格式列出每个文件的转录。

例如，您可以在 an4 数据库中查看声学模型训练数据库。

1 回答 1