0

我正在使用ranger,它是随机森林的快速实现。问题是我不知道如何解释$forest结果的组成部分。文件只是说

forest:保存的森林(如果write.forest设置为TRUE)。请注意,split.varIDs对象中的变量 ID 不一定代表 R 中的列号。

嗯,这并没有真正的帮助,所以我尝试自己检查它的组件,它们的名称不是不言自明的。

> names(ranger(Species ~ ., data = iris)$forest)
 [1] "dependent.varID"            "num.trees"
 [3] "child.nodeIDs"              "split.varIDs"
 [5] "split.values"               "is.ordered"
 [7] "class.values"               "levels"
 [9] "independent.variable.names" "treetype"

像这样的一些组件num.trees很容易理解,但像这样child.nodeIDs的东西真的令人兴奋。

> ranger(Species ~ ., data = iris)$forest$child.nodeIDs[[1]]
[[1]]
 [1]  1  3  5  0  7  9 11  0  0  0 13 15  0  0  0  0  0

[[2]]
 [1]  2  4  6  0  8 10 12  0  0  0 14 16  0  0  0  0  0

它是否记录在某处?

4

1 回答 1

1

请参阅该ranger::treeInfo功能的文档:https ://www.rdocumentation.org/packages/ranger/versions/0.11.2/topics/treeInfo

于 2019-07-05T19:45:46.593 回答