我正在尝试使用在 weka 库中实现的 SVM 分类对一些数据进行分类。我的分类代码如下:
BufferedReader reader = new BufferedReader(new FileReader(arffDataFile));
Instances data = new Instances(reader);
reader.close();
data.setClassIndex(0);
NumericToNominal filter = new NumericToNominal();
String[] options = new String[2];
options[0] = "-R";
options[1] = "1";
filter.setOptions(options);
filter.setInputFormat(data);
Instances newData = Filter.useFilter(data, filter);
newData.setClassIndex(0);
weka.classifiers.functions.LibSVM svm = new weka.classifiers.functions.LibSVM();
svm.buildClassifier(newData);
Evaluation eval = new Evaluation(newData);
eval.crossValidateModel(svm, newData, folds, new Random(1));
System.out.println(eval.toSummaryString("\nResults\n======\n", false));
System.out.println();
Arff 数据文件由 2973 个实例组成,每个实例有 27 个属性。
我的问题是,如何找出实例属性的权重。我需要调查哪些属性在分类过程中最有用。
我是机器学习领域的初学者,所以简单的语言和示例代码将不胜感激。
提前感谢您的帮助。