1

是否可以从 GBM 拟合模型中删除数据?我知道这个keep.data选项。但是,我希望能够在处理过程中保留数据,然后对其进行精简。另外,如果我只想保留一棵树以供未来预测(假设在拟合 1000 棵树之后,我认为 500 棵树在我的情况下效果最好,所以我想只保留这棵树。有没有安全的方法在不影响预测新数据的能力的情况下从拟合模型中删除多余的数据?

4

1 回答 1

0

我认为唯一真正有用的方法是按照您的建议移除多余的树木。

如果我在 gbm 示例上运行以下命令,我会得到树占对象大小的 80%,而数据占 10%。所以删除多余的树可以节省很多空间。

library(pryr)
bit <- unlist(lapply(gbm1,object_size))
round(bit/sum(bit),3)

您也可以尝试压缩对象,这会显着减小它的大小。

memCompress(serialize(gbm1, NULL), "bzip2")
unserialize(memDecompress(gbm1, type = "bzip2"))
于 2015-09-24T14:17:41.037 回答