0

我对如何使用HTK 进行语言建模感到困惑。 我遵循了Voxforge网站上的教程示例

http://www.voxforge.org/home/dev/acousticmodels/linux/create/htkjulius/tutorial

经过训练和测试,我得到了大约 78% 的准确率。我这样做是为了我的母语。现在我必须使用 HTK 进行语言建模。

是否有任何教程可以做同样的事情?请帮我。

谢谢speech_tri

4

1 回答 1

1

如果我正确理解您的问题,您正试图从“语法”转变为“n-gram 语言模型”方法。这两种方法是指定识别器将返回的响应中允许的单词组合的替代方法。遵循 Voxforge 流程后,您可能已经掌握了语法。

语言模型来自对文本语料库的分析,该语料库定义了单词一起出现的概率。使用的文本语料库可以非常专业。有许多分析工具,例如 SRILM ( http://www.speech.sri.com/projects/srilm/ ) 和 MITLM ( https://github.com/mitlm/mitlm ),它们将读取语料库并生成一个模型。

由于您使用的是母语中的单词,因此您需要一个独特的文本语料库来分析。获得测试语料库的一种方法是从您现有的语法中人为地生成一些句子并将其用作语料库。然后使用新的语言模型,您只需将识别器指向它而不是语法并希望获得最好的结果。

于 2017-01-21T08:46:09.707 回答