2

多类分类(MCC) 问题的背景下,一种常见的方法是从多个二元分类器构建最终解决方案。通常提到的两种组合策略是一对多和一对一。

为了区分该方法,更清楚地查看每个二元分类器尝试做什么。One-vs-all 的原始分类器试图将一个类与其他类分开。而一对一的原始尝试将一对一与 一对一分开也很容易混淆,称为全对全和全对。

我想通过以二元决策树的方式组合二元分类器来研究构建 MCC 分类器的这个相当简单的想法。举个例子:

       has wings?
     /           \
  quack?         nyan?
  /   \         /     \
duck  bird    cat     dog

正如你所看到的has wings?那样,2-vs-2 分类,所以我称这种方法为多对多。 问题是,我不知道从哪里开始阅读。有什么好论文可以推荐吗?

为了提供更多背景信息,我正在考虑使用多级进化算法 (MLEA) 来构建树。因此,如果有更直接的答案,那将是最受欢迎的。

编辑:有关更多上下文(也许您可能会发现它有用),我阅读了这篇论文,它是GECCO 2011 最佳论文获奖者之一;它使用 MLEA 以一对多的方式组成 MCC。这就是启发我寻找一种方法来修改它作为决策树构建器的原因。

4

2 回答 2

3

你想要的看起来很像决策树

来自维基:

用于统计、数据挖掘和机器学习的决策树学习使用决策树作为预测模型,它将对项目的观察映射到关于项目目标值的结论。这种树模型更具描述性的名称是分类树或回归树。在这些树结构中,叶子代表类标签,分支代表导致这些类标签的特征的结合。

于 2013-05-11T19:54:41.723 回答
1

Sailesh 的回答是正确的,因为您打算构建的是决策树。已经有许多算法用于学习此类树,例如随机森林。例如,您可以尝试weka,看看那里有什么可用的。

如果你对进化算法更感兴趣,我想提一下遗传编程。例如,您可以尝试我们在HeuristicLab中的实现。它可以处理数字类并尝试使用例如均方误差 (MSE) 作为适应度函数来找到将每一行映射到其各自类的公式(树)。

还有基于实例的分类方法,如最近邻或基于内核的方法,如支持向量机。基于实例的方法也支持多个类,但是对于内核方法,您必须使用您提到的方法之一。

于 2013-05-12T15:58:40.017 回答