11

我有一个数据集,其中包含年龄、城市、儿童年龄等信息以及结果(确认、接受)。

为了帮助对“工作流程”进行建模,我想根据以前的数据集自动创建一个决策树。

我看了一下http://en.wikipedia.org/wiki/Decision_tree_learning,我知道问题显然并不明显。

我只想就这个主题的一些算法或一些库提供建议,这些建议可以帮助我构建基于样本的决策树。

4

2 回答 2

14

你应该看看Weka,一个免费的基于 Java 的监督学习套件。

将您的数据转换为 Weka 简单的基于文本的.arff 格式后,您应该能够使用 GUI 或命令行界面来训练和测试该数据上的各种不同分类器,包括:

  • 决策树
  • 神经网络
  • 基于规则的系统
  • 支持向量机 (SVM)
  • 各种类型的回归

尝试使用此界面应该可以让您轻松尝试不同的分类器和训练参数,以确定哪些分类器在您的数据上表现最好。

您还可以使用 API 将 Weka 集成到您自己的源代码中。

于 2009-10-13T12:36:39.403 回答
2

如果您想比较来自 Weka 的不同类型决策树的性能,请参阅 TunedIT.org 中收集的基准测试结果:

http://tunedit.org/results?d=UCI&a=Weka*tree

使用算法/数据集的下拉列表和名称模式来选择应该呈现的结果。

于 2010-05-17T14:21:04.647 回答