2

3 个图表 (i)、(ii)、(iii)这里显示了具有 2 个数值属性(x 和 y 轴)和具有两个类别(圆形和方形)的目标属性的训练集。

我现在想知道数据挖掘算法(最近邻、朴素贝叶斯和决策树)解决每个分类问题的效果如何。

我认为朴素贝叶斯(在属性不相关的朴素假设下)比(i)和(iii)更好地解决了第二个问题,因为这里的数值属性往往更独立于彼此。

4

1 回答 1

9

如果您想在这种情况下使用每个给定的方法:

第一个可以用决策树方法最好地解决,因为类可以按轴分开。我的意思是在 x 轴上画一条垂直线,将值分隔为左侧和右侧,并在 y 轴上画另一条垂直线,这样你会看到类将很好地分开。

正如您提到的,第二个可以被视为朴素贝叶斯问题。

第三个可以用k最近邻方法解决。方形类在坐标系上的位置较近,圆形类也可以分类有一些错误。

于 2013-02-25T18:31:38.530 回答