这是随机森林分类如何工作的样本数据集。我知道通过选择随机 k 点然后取某种平均值来构建多个决策树?
但在这种情况下,我有 10 棵树,有 10 个不同的数据点,如果我要选择随机的 k 个点,它会像这样:
x_train = [10, 20, 30, 40, 50, 60, 70, 80, 90, 100]
y_train = [0, 0, 1, 0, 1, 1, 1, 0, 0, 1]
object = RandomForestClassifier(n_estimators=10, criterion='entropy')
object.fit(x_train, y_train)
然后我们制作一个图并拆分 random_k_1 以便它在每个拆分中最大化一个类别。
那我们怎么办?比如取某种平均值?如果是,我们应该怎么做,我们只有 0, 1 作为 y^?对不起,我无法解释这个问题,我迷路了,无法描述这个问题。
random_k_1 = [[10, 0], [30, 1], [70, 1]]