我有一个数据集,其中包含年龄、城市、儿童年龄等信息以及结果(确认、接受)。
为了帮助对“工作流程”进行建模,我想根据以前的数据集自动创建一个决策树。
我看了一下http://en.wikipedia.org/wiki/Decision_tree_learning,我知道问题显然并不明显。
我只想就这个主题的一些算法或一些库提供建议,这些建议可以帮助我构建基于样本的决策树。
我有一个数据集,其中包含年龄、城市、儿童年龄等信息以及结果(确认、接受)。
为了帮助对“工作流程”进行建模,我想根据以前的数据集自动创建一个决策树。
我看了一下http://en.wikipedia.org/wiki/Decision_tree_learning,我知道问题显然并不明显。
我只想就这个主题的一些算法或一些库提供建议,这些建议可以帮助我构建基于样本的决策树。
你应该看看Weka,一个免费的基于 Java 的监督学习套件。
将您的数据转换为 Weka 简单的基于文本的.arff 格式后,您应该能够使用 GUI 或命令行界面来训练和测试该数据上的各种不同分类器,包括:
尝试使用此界面应该可以让您轻松尝试不同的分类器和训练参数,以确定哪些分类器在您的数据上表现最好。
您还可以使用 API 将 Weka 集成到您自己的源代码中。
如果您想比较来自 Weka 的不同类型决策树的性能,请参阅 TunedIT.org 中收集的基准测试结果:
http://tunedit.org/results?d=UCI&a=Weka*tree。
使用算法/数据集的下拉列表和名称模式来选择应该呈现的结果。