我是 SAP World 的新手,我正在尝试使用安装在 SAP HANA Studio 中的 R Server(HANA Studio 版本:2.3.8 和 R Server 3.4.0 版本)
我的任务是:
- 在 HANA Studio 中的 R 服务器上训练 randomForest 模型(借助 HANA 上的 RLANG 程序)
- 将 randomForest 模型保存为 HANA 中的 PAL 模型对象
- 使用此模型对 HANA 中的新数据进行预测
这是一个 RLANG 程序的小示例,用于训练在 HANA 上保存模型:
PROCEDURE "PA"."RF_TRAIN" (
IN data "PA"."IRIS",
OUT modelOut "PA"."TRAIN_MODEL"
)
LANGUAGE RLANG
SQL SECURITY INVOKER
DEFAULT SCHEMA "PA"
AS
BEGIN
require(randomForest)
require(dplyr)
require(pmml)
# iris <- as.data.frame(data)
data(iris)
iris <- iris %>% mutate(y = factor(ifelse(Species == "setosa", 1, 0)))
model <- randomForest(y~Sepal.Length + Sepal.Width + Petal.Length + Petal.Width, iris,
importance = TRUE,
ntree = 500)
modelOut <- as.data.frame(pmml(model))
END;
(请不要混淆,我没有使用我的输入数据进行模型训练,这不是一个真实的例子)
以下是 SAP HANA 上包含模型的表的外观:
在此示例中,培训有效,但我不确定如何将 randomForest-Object 保存在 SAP HANA 数据库中,或者如何将 randomForest-Object 转换为图片中的类似对象。
将不胜感激任何帮助:)