0

我尝试通过命令行使用以下命令运行 MALLET 主题建模:

bin/mallet import-dir --input data\my_text \
             --output my.mallet \
             --remove-stopwords TRUE \
             --keep-sequence TRUE \
             --gram-sizes 1,2 \
             --keep-sequence-bigrams TRUE

我收到以下错误:

Exception in thread "main" java.lang.IllegalArgumentException: Unrecognized option 10: 2
    at cc.mallet.util.CommandOption$List.process(CommandOption.java:344)
    at cc.mallet.util.CommandOption.process(CommandOption.java:146)
    at cc.mallet.classify.tui.Text2Vectors.main(Text2Vectors.java:122)

看来 MALLET 将逗号后的“2”识别为第 10 个参数。谁能让我知道我的输入是否错误以及如何纠正?

谢谢!

4

1 回答 1

1

引用--gram-sizes选项的参数

--gram-sizes "1,2" \

它会起作用。

于 2015-06-05T09:50:29.740 回答