我试图了解 Kaldi 的内部工作原理,但是无法理解kaldi 文档的技术细节。
我想首先对各种对象有一个高层次的理解,以帮助消化所呈现的内容。我特别想知道 .tree、fina.mdl 和 HCLG.fst 文件是什么,生成它们需要什么以及如何使用它们。
我隐约明白(如果我错了,请纠正我):
- final.mdl 是声学模型,包含从一个电话转换到另一个电话的概率。
- HCLG.fst 是一个图,给定一系列音素,它将根据词典、语法和语言模型生成最可能的单词序列。
- 解码图是生成 HCLG.fst 的术语
- 不太清楚添加自循环是什么,它类似于 Kleene 运算符吗?
- lattice 包含话语的替代词序列。
我知道有很多内容要介绍,但感谢您提供任何帮助!