2

在尝试使用 pmml 包将 R 分类器导出到 PMML 时,我注意到树中节点的类分布没有导出。

PMML 通过 ScoreDistribution 元素支持这一点:http ://www.dmg.org/v1-1/treemodel.html

无论如何在 PMML 中有这些信息吗?我想用另一个依赖于此信息的工具来阅读 PMML。

我正在做类似的事情:

library(randomForest)
library(pmml)

iris.rf <- randomForest(Species ~ ., data=iris, importance=TRUE,proximity=TRUE)
pmml(iris.rf)
4

1 回答 1

4

您能否提供更多信息……例如,您尝试使用哪个功能。

例如,如果您使用的是 randomForest 包,我相信它不会提供有关分数分布的信息;所以 PMML 表示也不能。但是,如果您使用默认值,则分类 ceses 的参数“nodesize”例如等于 1,这意味着终端节点将具有 ScoreDistribution,例如:

ScoreDistribution 值=predictedValue 概率=“1.0”/>

ScoreDistribution 值=AnyOtherTargetCategoty 概率=“0.0”/>

如果您使用的是 rpart 树模型,则 pmml 函数会输出分数分布信息。也许您可以给我们您使用的确切命令?

于 2014-02-24T21:06:56.187 回答