7

在is和 in it isRandomForestClassifier的默认值中,有什么具体原因吗?max_featuressqrt(n_features)RandomForestRegressorn_features

4

2 回答 2

6

这是基于经验结果的启发式方法。平均而言,作为默认设置,设置 max_features=sqrt(n_features) 用于分类和设置 max_features=n_features 用于回归似乎是一个更好的选择。

这种启发式源于这篇论文: http: //orbi.ulg.ac.be/bitstream/2268/9357/1/geurts-mlj-advance.pdf

在任何情况下,交叉验证这个参数当然总是一个更好的主意。

于 2013-08-29T08:59:06.077 回答
0

请注意,您可能需要设置:

max_features = 'sqrt'  

而不是建议的:

max_features=sqrt(n_features)

取决于您正在运行的版本。

于 2017-04-21T21:39:39.043 回答