2

我在不同的分类器中预测了我的数据。我想整合他们的结果,以获得更好的最终结果。在R中可能吗?
让我们说:

SVMpredict=[1 0 0 1...]
RFpredict=[1 1 0 1 ...]
NNpredict=[0 0 0 1 ...] 

是否可以通过 R 中的任何集成技术组合结果?如何?
谢谢

编辑:
我在不同的样本(我的案例 DNA 染色体)上运行我的分类器。在某些示例中,SVM 比其他示例(如 RF)效果更好。我想要一种通过考虑哪个分类器效果更好来整合结果的技术。
例如,如果我取输出概率的平均值并对它们进行四舍五入,则会认为所有分类器的结果都相同。但是当 SVM 工作得更好时,我们应该考虑 SVM(准确率 86%)的结果具有 60% 的重要性和 RF 的 25%(72% 的准确率)和 15% 的 NN(64% 的准确率)。(这些数字只是为了澄清的例子)
无论如何我可以做到吗?

4

1 回答 1

1

这取决于分类器输出的结构。如果它是您提供的 {0,1} 结果,您可以对预测进行平均,然后对其进行平均和四舍五入:

round((SVMpredict+RFpredict+NNpredict)/3)

如果您知道分类器的性能,加权平均值是一个好主意 - 偏爱表现更好的分类器。核心方法是通过optim函数优化权重。

如果您知道每个预测的类别概率,最好将它们平均而不是让它们仅仅投票(上面的 {0,1} 输出案例)。

于 2015-05-05T11:42:20.060 回答