我不确定 weka GUI 是否有直接的选择。但是,您可以通过命令行实现相同的目的
java weka.classifiers.meta.FilteredClassifier -F weka.filters.unsupervised.attribute.RemoveType -W weka.classifiers.trees.RandomForest -t G:\pub-resampled-0.5.arff -T G:\test.csv.arff -p 1 -distribution > G:\out.txt
在上面的例子中,第一个属性是一个标识符(字符串)。RemoveType 过滤器将在构建模型时删除所有字符串字段。但是,您仍然可以通过将其作为参数传递给-p来要求 weka 将该标识符作为输出(预测)的一部分。在我的例子中,第一个属性 (partner_id) 是标识符,因此它与预测一起列在输出中。(-distribution 选项是输出所有类标签的预测分数)。您可以从http://weka.wikispaces.com/Instance+ID获取更多详细信息
=== Predictions on test data ===
inst# actual predicted error distribution (partner_id)
1 1:? 2:0 0,*1 (8i7t3)
2 1:? 2:0 0,*1 (8i7u1)
3 1:? 2:0 0,*1 (8i7um)
4 1:? 2:0 0.1,*0.9 (8i7ux)
5 1:? 2:0 0,*1 (8i7va)
6 1:? 2:0 0,*1 (8i7vb)
7 1:? 2:0 0,*1 (8i7vf)
希望你觉得这很有帮助..