3

是否有在 R 中导出 gbm 模型的标准(或可用)方法?PMML 可以工作,但是当我尝试使用 pmml 库时,可能不正确,我得到一个错误:

例如,我的代码如下所示:

  library("gbm")
  library("pmml")

  model <- gbm(
      formula,
      data = my.data,
      distribution = "adaboost",
      n.trees = 450,
      n.minobsinnode = 10,
      interaction.depth = 4, shrinkage=0.05, verbose=TRUE)
  export <- pmml(model)
  # and then export to xml

我得到的错误是:

Error in UseMethod("pmml") : no applicable method for 'pmml' applied to an object of class "gbm"

我也尝试过传入数据集。在任何情况下,我都可以接受另一种我可以通过编程方式解析的格式(我将在 JVM 上评分),但如果有办法让它发挥作用,PMML 会很棒。

4

1 回答 1

3

您可以使用r2pmmlpackage来完成这项工作。目前,它支持回归(即。distribution = "gaussian")和二元分类(即。distribution = "adaboost"distribution = "bernoulli")模型类型。

以下是Auto MPG数据集的示例代码:

library("gbm")
library("r2pmml")

auto = read.csv(file = "AutoNA.csv", header = TRUE)

auto.formula = gbm(mpg ~ ., data = auto, interaction.depth = 3, shrinkage = 0.1, n.trees = 100, response.name = "mpg")
print(auto.formula)

r2pmml(auto.formula, "/tmp/gbm.pmml")
于 2015-02-20T09:34:30.437 回答