如果我有一个训练有素的随机森林,有什么方法可以让我获得每个班级在测试样本上的森林获得的票数?一定比例的选票会更好。
类似于 CVRTrees::predict 的东西,但会得到原始输出以及预测的类。
谢谢
编辑进一步解释我的目标,以便我可能得到一个解决我的问题的答案,而不一定是我的问题。
要回答我知道多少,它很少。
这是一个真实世界的应用程序,我正在努力让自己尽快了解所有这些。
本质上,我研究判别分类器,要求我需要能够比较 2 个(或更多)独立分类器之间的输出。我的意思是独立的意思是他们可能知道也可能不知道整个类集,但是确实存在一组类,其中所有分类器都包含此类类的子集。
我最初的想法是从每个分类器中收集有关分类的元信息,理想情况下将包含某种形式(其中 15% 是 A,78% 的机会是 B)[我知道机会是坏话,但我会离开它]。如果我能得到该输出,我将能够根据分配给每个分类器的动态性能权重执行最终分类。
这个想法是我可以使用一个非常简单的基于规则的分类器来进行初始分类,而更奇特的分类器有时间训练。理想情况下,学习分类器可能支持比规则分类器更多的类,并且随着时间的推移,它主要被使用。