0

我想将我所有的 n-gram 文件转换为一个ARPA文件。它将用作语音识别的语言模型。

我有不同的 n-gram 文件,2-gram、3-gram 和 4-gram。以 2-gram 文件为例

two grams -- frequency similar degree 32 Writing writes 1 towars their 3 country feature 1 like gold 446 like golf 64

我怎样才能做到这一点?

4

1 回答 1

1

在 srilm 包中,将计数转换为 arpa 的命令是:

  ngram-count -read file.counts -lm file.lm

这样做时,您只需要最大订单计数文件,不需要 2 克,因为低订单计数是从高订单计数重新计算的。

在这里您可以找到有关 ngram-count 的详细文档。

于 2015-08-03T08:33:25.407 回答