0

我想知道是否有可能有一个包含强制性元素和可选元素的管道。可选的是有条件的。例如,您可以拥有一个带有下采样元素的管道,或者您可以拥有相同的管道而不进行下采样。所以

from imblearn.pipeline import Pipeline as IMBPipeline
import xgboost as xgb
from imblearn.under_sampling import RandomUnderSampler 

pipe = IMBPipeline([
                         ('sampling',RandomUnderSampler()),
                         ('clf', xgb.XGBClassifier(**params, n_jobs=-1))
                        ])

如果你有一个不平衡的数据集,你只有采样部分。但采样部分仍在进行中,只是有条件的。有这样的吗?

4

1 回答 1

0

据我所知,这个功能不存在。但是,对于这个特定问题,您始终可以运行欠采样,如果您的数据集不平衡,欠采样器将根本没有效果(或很少)。

于 2020-03-25T16:24:54.693 回答