使用 xgboost 可以定义子采样率,以便每次迭代使用一定百分比的数据。但是,是否可以指定应该使用的确切子集?我能想到使用 xgboost 执行此操作的唯一方法是自己管理迭代过程,如https://github.com/dmlc/xgboost/blob/master/demo/guide-python/boost_from_prediction.py。并指定一个不同的dtrain
每次迭代(dtrain
然后每次都包含一个特定的子样本)。
有没有更优雅的方法来做到这一点?
使用 xgboost 可以定义子采样率,以便每次迭代使用一定百分比的数据。但是,是否可以指定应该使用的确切子集?我能想到使用 xgboost 执行此操作的唯一方法是自己管理迭代过程,如https://github.com/dmlc/xgboost/blob/master/demo/guide-python/boost_from_prediction.py。并指定一个不同的dtrain
每次迭代(dtrain
然后每次都包含一个特定的子样本)。
有没有更优雅的方法来做到这一点?