我想找到一种在 caret 包中定义 gbm 权重的方法。“caret”包的“train”函数中有一个参数“weights”,但描述说“这个参数只会影响允许案例权重的模型”。据我了解,“gbm”确实支持定义权重,但我不知道定义权重的格式。它只是 c(1,10) - 其中 1 代表多数类,10 代表少数类吗?
第二个问题是关于 Kappa 统计量的。我读到 Kappa 是类不平衡数据集的更好性能指标,但不明白如何。对于类不平衡数据集,为什么 Kappa 是比 ROC 更好的性能指标,我将不胜感激。
谢谢。