有人可以解释R 包中的Cover
列是如何在函数中计算的吗?xgboost
xgb.model.dt.tree
在文档中,它说 Cover “是衡量受拆分影响的观察数量的指标”。
xgboost
当您运行此函数的文档中给出的以下代码时,Cover
树 0 的节点 0 为 1628.2500。
data(agaricus.train, package='xgboost')
#Both dataset are list with two items, a sparse matrix and labels
#(labels = outcome column which will be learned).
#Each column of the sparse Matrix is a feature in one hot encoding format.
train <- agaricus.train
bst <- xgboost(data = train$data, label = train$label, max.depth = 2,
eta = 1, nthread = 2, nround = 2,objective = "binary:logistic")
#agaricus.test$data@Dimnames[[2]] represents the column names of the sparse matrix.
xgb.model.dt.tree(agaricus.train$data@Dimnames[[2]], model = bst)
火车数据集中有 6513 个观测值,所以谁能解释为什么Cover
树 0 的节点 0 是这个数字的四分之一(1628.25)?
此外,Cover
对于树 1 的节点 1 是 788.852 - 这个数字是如何计算的?
任何帮助将非常感激。谢谢。