0

我开始应用数据挖掘算法。现在我研究决策树。互联网上有很多关于 C4.5 和 ID3 算法的资料,但我想知道这两种算法的实用细节、优缺点和一些技术细节。如果有此类材料的链接,我会很高兴

4

1 回答 1

3

决策树的两个优点是它们能够处理嘈杂的数据,并且它们提供了对数据的直观解释(您可以很容易地看到树认为哪些属性最重要)。缺点是它们是贪心算法(它们选择分支属性而不考虑这如何影响最终分类精度),因此它们不一定会产生最佳树结构。决策树很容易融入到集成方法中,例如随机森林

C4.5 是对 ID3 的改进,使其能够处理实值属性(ID3 使用分类属性)和缺失属性。互联网上有很多关于这两种算法的描述。维基百科对ID3C4.5都有描述。对于这两种算法的另一种描述,您可以从这里开始。

于 2012-12-03T14:49:03.243 回答