我想知道以下三种方法中哪种方法最适合执行属性选择:
- 使用元分类器
- 过滤法
- 本机方法,直接使用属性选择类
我使用的分类器是朴素贝叶斯。
谁能指导我找到最佳选择?
我想知道以下三种方法中哪种方法最适合执行属性选择:
我使用的分类器是朴素贝叶斯。
谁能指导我找到最佳选择?
有一种理论叫做没有免费的午餐。您应该在您的问题中尝试所有这三种方法,并在您的域中进行测量。
好吧,没有单一的答案。
您可以使用决策树分类器(如装袋)并选择分类器做出分支决策的属性。您当然可以通过查看树来查看分支和进行分支的属性(这些属性很重要)。
您可以使用前向选择或后向消除技术。(a) 在前向选择中,使用验证/测试集误差最小的单一特征。然后将此功能包含在您的功能池中,一次尝试其余功能,并再次选择给您带来最少错误的功能。(b) 在后向消除中,使用所有特征并取错误率。然后一次消除一个特征。然后选择一个从你的特征池中取出,它可以最大程度地减少错误。
除非您对功能数量(停止标准)感到满意,否则请继续该过程。
错误 - 您可以考虑均方根误差。其他人也可以做得很好。