我正在分析RandomForestClasifier
并需要一些帮助。
max_features
参数给出了随机森林中分裂的最大特征数,通常定义为sqrt(n_features)
. 如果 m 是 n 的 sqrt,则 DT 形成的组合没有 nCm。如果 nCm 小于 n_estimators(随机森林中的决策树数)怎么办?
示例:对于 n = 7,max_features
为 3,因此 nCm 为 35,这意味着决策树的 35 个唯一特征组合。现在对于n_estimators
= 100,剩下的 65 棵树会有重复的特征组合吗?如果是这样,树会不会在答案中引入偏见?