3

我正在寻找一种算法来构建用于对象检测的分类器。分类器将用于通过对象的特征来检测交通场景中的汽车。我研究过提升和多实例学习等算法,但它们似乎不适合我的情况。我有两个数据集,一个带有正样本,一个带有负样本,但这些集合包含一小部分错误(<10%)。无法手动删除数据集中的错误,因为我的目标是在线生成数据集而无需人工干预。

所以我的问题是:有没有人知道一个合适的算法(如果存在的话)来训练一个分类器,它可以处理正负训练集中相对较小百分比的错误?

谢谢,汤姆

4

1 回答 1

0

所有现实世界的数据都会有错误。如果您知道特定错误,则应在训练之前对其进行过滤。捕捉这些错误的最佳方法是逐步训练您的分类器。每次添加到语料库并重新训练新分类器时,都应该检查精度、召回率和 F1。如果新分类器的性能更差,您就知道您在工作语料库中添加了一些必须退出的垃圾。

你绝对不应该把垃圾留在你的语料库中,因为你会扼杀你的准确性。如果您从不受信任的来源获取数据,则可能会故意用不良数据破坏您的分类器。因此,在将新数据输入分类器之前,您应该让某种过滤器或领域专家查看新数据,以确保您维护黄金标准语料库。

于 2013-03-12T22:41:25.917 回答