0

我想知道以下三种方法中哪种方法最适合执行属性选择:

  1. 使用元分类器
  2. 过滤法
  3. 本机方法,直接使用属性选择类

我使用的分类器是朴素贝叶斯。

谁能指导我找到最佳选择?

4

2 回答 2

1

有一种理论叫做没有免费的午餐。您应该在您的问题中尝试所有这三种方法,并在您的域中进行测量。

于 2012-03-26T11:37:57.287 回答
0

好吧,没有单一的答案。

  1. 您可以使用决策树分类器(如装袋)并选择分类器做出分支决策的属性。您当然可以通过查看树来查看分支和进行分支的属性(这些属性很重要)。

  2. 您可以使用前向选择或后向消除技术。(a) 在前向选择中,使用验证/测试集误差最小的单一特征。然后将此功能包含在您的功能池中,一次尝试其余功能,并再次选择给您带来最少错误的功能。(b) 在后向消除中,使用所有特征并取错误率。然后一次消除一个特征。然后选择一个从你的特征池中取出,它可以最大程度地减少错误。

除非您对功能数量(停止标准)感到满意,否则请继续该过程。

  1. 我个人首先使用 ranker 算法和 infogain 属性评估器对属性进行排名,然后使用 2(a) 或 2(b) 来选择属性。

错误 - 您可以考虑均方根误差。其他人也可以做得很好。

于 2012-03-30T02:55:09.910 回答