1

我有一组具有 14 个常规属性的数据。我正在尝试从该训练数据中创建Rapidminer中的最佳决策树,以便我可以在评分数据上使用该树。

但是我不确定决策树使用哪些参数(例如:标准、最小增益、置信度等)?我也不确定我可以/应该将哪些其他运算符(如果有的话)应用于我的模型?

谁能给我一些关于什么最有效的一般提示?

我所拥有的数据是尝试确定是否有人开设了新的银行账户,他们的信用状况是否良好。我有信用状况、账户类型、历史、就业、性别、工作等信息。

谢谢你。

4

1 回答 1

1

一般来说,样本的数量会更好地帮助机器学习过程。请参考此链接,这可能对您有所帮助http://www.simafore.com/blog/bid/55751/how-to-use-decision-trees-for-credit-scoring-using-rapidminer-part -1

于 2012-11-02T09:18:52.770 回答