我正在尝试使用一些自定义随机森林实现来解决二进制分类问题。
目标是预测项目属于 A 类的可能性。评估策略的定义是,假阳性(A 的可能性很高,而实际的类别是 B)比假阴性(A 的可能性低,而实际课程是 A)。
应该如何调整标准算法以利用这一点来获得更高的评估分数?
我正在尝试使用一些自定义随机森林实现来解决二进制分类问题。
目标是预测项目属于 A 类的可能性。评估策略的定义是,假阳性(A 的可能性很高,而实际的类别是 B)比假阴性(A 的可能性低,而实际课程是 A)。
应该如何调整标准算法以利用这一点来获得更高的评估分数?
如果您还没有,请尝试使用包 rfUtilities:https ://cran.r-project.org/web/packages/rfUtilities/rfUtilities.pdf
它旨在通过预测单个类别出现的可能性来处理类别不平衡。