0

在决策树中对抗噪声的好策略是什么?

在我的训练数据中,

我有两条具有相同属性的记录,但它们给出不同的分类。

  1. 女,奢华,LV,是的
  2. 女、奢华、LV、无

根据我的阅读,它说要返回这两条记录的复数分类。

但是,当我想进行预测时,这会引发一个问题,因为我的预测的输出应该是是或否。

因此,试图找出在这种情况下我可以使用哪些策略来预测。

谢谢你。

4

1 回答 1

0

当类别预测未定时:

  1. 最简单(也是常见)的方法是预测多数类
  2. 获取更多信息。例如,包括附加属性(如果可用)或获取更多训练样本(如果可用)。
  3. 删除一些信息。目的是在尽可能多地保留预测信息的同时去除尽可能多的噪声源。通常它是通过删除无用的属性来完成的。在树的情况下,可以通过修剪来完成。最终,您可以删除异常值(例如错误测量的样本),但您必须知道哪个样本是异常值。
于 2012-11-24T11:18:55.763 回答