我正在寻找一种方法来编写一个在另一个脚本中自动加载脚本的一部分的函数。
这是我的问题:我创建了一个脚本,对数据集执行预处理,然后应用 xgboost。
我需要自动将此脚本中实现的预处理(例如:创建新变量,用平均值替换 NA - 保持初始数据集的平均值)应用于新数据集。这对用户应该是完全透明的(没有复制粘贴,只有一个带有新集合的函数和一个模型的 Rdata 作为参数输入)。
我的想法是将带有预处理的脚本部分“存储”为 Rdata 中的对象,然后当我在新脚本中加载此对象时,预处理将应用于新数据集。
有没有人知道如何做到这一点?