5

我正在为可能具有多个可能分类器的问题编写机器学习解决方案,具体取决于数据。所以我收集了几个分类器,每个分类器在某些条件下都比其他分类器表现更好。我正在研究元分类策略,我看到有几种算法。谁能指出它们之间的根本区别?

4

1 回答 1

10

投票算法是简单的策略,您可以通过例如选择在大多数情况下出现的类来聚合分类器决策的结果。堆叠/分级策略是这个概念的概括。与其简单地说“好的,我有一个方案v,我将使用它在我的k分类器中选择最佳答案”,而是创建另一个抽象层,在这里你实际上学习预测正确的标签有k投票。

简而言之,基本的投票/堆叠/分级方法可以概括为:

  • 投票——你有一些固定的方法v,给出的答案a_1,...,a_k会导致a=v(a_1,...,a_k)
  • 堆叠 - 您使用答案作为问题的新表示,因此对于(x_i,y_i)您获得的每个答案(a_i_1,...,a_i_k),因此创建训练样本((a_i_1,...,a_i_k),y_i)并在其上训练元分类器
  • 分级 - 您为每个分类器训练一个单独的元分类器,k以预测其当前点的“分类等级”,并使用它来做出决定
于 2013-09-14T15:12:18.370 回答