我有一个非常大的数据集需要用于分类,我对数据进行了采样,但这并不能保证我的输出中会包含整个标签。如何对数据进行采样以涵盖所有标签?此外,我想保存我在此过程中使用的label encoder
和,以便将它们用于增量学习。RandomForestClassifier
我搜索了使用RandomForestClassifier
我发现该set_warm
功能仅用于添加额外的估计器而不是更新权重。并且partial_fit
不支持使用随机森林。所以我的第二个问题是如何更新label encoder
和RandomForestClassifier
训练可能有其他标签和更多数据点的另一个数据集?
问问题
92 次