我尝试通过命令行使用以下命令运行 MALLET 主题建模:
bin/mallet import-dir --input data\my_text \
--output my.mallet \
--remove-stopwords TRUE \
--keep-sequence TRUE \
--gram-sizes 1,2 \
--keep-sequence-bigrams TRUE
我收到以下错误:
Exception in thread "main" java.lang.IllegalArgumentException: Unrecognized option 10: 2
at cc.mallet.util.CommandOption$List.process(CommandOption.java:344)
at cc.mallet.util.CommandOption.process(CommandOption.java:146)
at cc.mallet.classify.tui.Text2Vectors.main(Text2Vectors.java:122)
看来 MALLET 将逗号后的“2”识别为第 10 个参数。谁能让我知道我的输入是否错误以及如何纠正?
谢谢!