我正在做一个项目,我有很多分析师在 R 中创建统计模型。他们通常为我提供模型对象(.Rdata 文件),我会自动为各种数据集执行它们。
我的问题是:
我可以使用数据库并将这些 .RData 文件保存在那里吗?关于这样做的任何提示?(我目前将 .Rdata 文件存储到磁盘并使用数据库存储位置信息)
我从其他分析师那里得到了很多 R 脚本,他们在创建模型之前已经对数据进行了一些预处理。有没有人有使用 PMML 使这个过程在没有人工干预的情况下可重复的经验?PMML 将预处理步骤、建模步骤存储为标记标签,并将在新数据集上重复相同的操作。
感谢您的建议和反馈。
-残酷的