0

在 Python DecisionTree 模块主页 ( DecisionTree-1.6.1 ) 上,他们提供了一段示例代码。这里是:

dt = DecisionTree( training_datafile = "training.dat", debug1 = 1 )

dt.get_training_data()

dt.show_training_data()

root_node = dt.construct_decision_tree_classifier()

root_node.display_decision_tree(" ")

test_sample = ['exercising=>never', 'smoking=>heavy',
'fatIntake=>heavy', 'videoAddiction=>heavy']
classification = dt.classify(root_node, test_sample)

print "Classification: ", classification

我的问题是:如何从变量中指定样本数据(此处为 test_sample)?在项目主页上,它说:“您通过首先构建一个新的数据向量来对新数据进行分类:”我已经四处搜索,但无法找出数据向量是什么或我的问题的答案。

任何帮助,将不胜感激!

4

1 回答 1

0

嗯,这个例子说明了一切。它是一个字符串列表,其特征和值由“=>”分隔。使用该示例,特征是“锻炼”,其值为“从不”。

于 2012-07-09T21:12:48.470 回答