5

我正在对 R 中的索赔频率(泊松分布)进行建模。我正在使用gbmandxgboost包,但似乎xgboost没有偏移参数来考虑风险?

在 agbm中,人们会按如下方式考虑风险:

gbm.fit(x = train,y = target, n.trees = 100,distribution = "poisson", offset = log(exposure))

如何使用`xgboost 实现相同的效果?

PS:我不能使用曝光作为预测器,因为每次观察到索赔时都会创建一个新的 obs。

4

2 回答 2

4

创建 xgboost 矩阵后,您可以使用 setinfo 和 base_margin 属性设置偏移量,例如:

setinfo(xgtrain, "base_margin", log(d$exposure))

您可以从我在这里提出的类似问题中查看完整示例:XGBoost - Poisson distribution with varying exposure / offset

于 2016-09-13T14:59:19.987 回答
0

通过曝光标准化您的计数并将曝光用作权重。有关更多详细信息,请参阅答案。

于 2016-09-02T04:18:21.257 回答