我正在将 R randomForest 模型导出到 PMML。生成的 PMML 始终将类作为 DataDictionary 元素的第一个元素,这并不总是正确的。
有没有办法解决这个问题,或者至少使用自定义扩展元素增加 PMML?这样我就可以把类索引放在那里。
我查看了 pmml 包文档以及 pmmlTransformations 包,但找不到任何可以帮助我解决此问题的内容。
我正在将 R randomForest 模型导出到 PMML。生成的 PMML 始终将类作为 DataDictionary 元素的第一个元素,这并不总是正确的。
有没有办法解决这个问题,或者至少使用自定义扩展元素增加 PMML?这样我就可以把类索引放在那里。
我查看了 pmml 包文档以及 pmmlTransformations 包,但找不到任何可以帮助我解决此问题的内容。
通过 PMML 类,我假设您是指 PMML 模型属性中的模型类型(分类与回归)?如果是这样,则模型类型不是由 DataDictionary 的第一个元素的数据类型确定的……它们是完全独立的。模型类型由 R 认为的模型类型确定。R 随机森林对象确定它认为的类型 (model$type),即 pmml 函数导出的模型类型。如果您希望您的模型是某种类型,只需确保让 R 知道...例如,如果您使用 iris 数据集,如果您的预测变量是 Sepal.Length,R 将正确假设它是回归模型。如果您坚持将其视为分类模型,请尝试使用 as.factor(Sepal.Length) 代替。