我想将我所有的 n-gram 文件转换为一个ARPA文件。它将用作语音识别的语言模型。
我有不同的 n-gram 文件,2-gram、3-gram 和 4-gram。以 2-gram 文件为例
two grams -- frequency similar degree 32 Writing writes 1 towars their 3 country feature 1 like gold 446 like golf 64
我怎样才能做到这一点?
我想将我所有的 n-gram 文件转换为一个ARPA文件。它将用作语音识别的语言模型。
我有不同的 n-gram 文件,2-gram、3-gram 和 4-gram。以 2-gram 文件为例
two grams -- frequency similar degree 32 Writing writes 1 towars their 3 country feature 1 like gold 446 like golf 64
我怎样才能做到这一点?
在 srilm 包中,将计数转换为 arpa 的命令是:
ngram-count -read file.counts -lm file.lm
这样做时,您只需要最大订单计数文件,不需要 2 克,因为低订单计数是从高订单计数重新计算的。
在这里您可以找到有关 ngram-count 的详细文档。