0

我正在使用sklearn's Isolation Forest 并使用它来预测其他样本(来自同一人群)。由于样本量大,我无法在整个数据上拟合 Forest(因为我无法将该数据转换为 pandas 数据框),因此采用了这种方法。

由于需要时间,我正在考虑减少树木的最大深度。根据sklearn的 文件, "

每棵树的最大深度设置为 ceil(log_2(n)),其中是用于构建树的样本数(有关更多详细信息,请参见 (Liu et al., 2008))

"

但由于我只想要最顶层的异常,我想我可以将树的深度限制在甚至小于 ceil(log_2(n)) 的范围内。而且我认为这可能会减少使用该模型进行拟合和进行预测的时间。但sklearn不支持参数max_depth。有没有办法指定max_depthinsklearn

4

0 回答 0