我正在尝试使用以下命令生成 arpa 格式语言模型:
text2wngram < weather.txt | grep -v "</s> <s>" > weather.wngram
wngram2idngram -vocab weather.vocab < weather.wngram > weather.idngram
idngram2lm -vocab_type 0 -idngram weather.idngram -vocab weather.vocab -arpa weather.lm
但是第二个命令wngram2idngram 不起作用并引发以下错误:
text2idngram:错误:必须指定 idngram 文件。
我如下更改参数,它可以工作。
wngram2idngram -vocab weather.vocab -idngram weather.idngram < weather.wngram
我的问题是哪一个是正确的?我正在使用 cmulmtk 版本 3。