我想使用包中的mice
函数创建插补策略mice
。问题是我似乎无法predict
在这个包中找到任何新数据的方法(或者它的表亲)。
我想做这样的事情:
require(mice)
data(boys)
train_boys <- boys[1:400,]
test_boys <- boys[401:nrow(boys),]
mice_object <- mice(train_boys)
train_complete_boys <- complete(train_boys)
# Here comes a hypothetical method
test_complete_boys <- predict(mice_object, test_boys)
我想找到一些可以模拟上面代码的方法。现在,完全可以分别mice
对训练数据集和测试数据集进行单独的操作,但从逻辑的角度来看,这似乎是不正确的——你拥有的所有信息都在训练数据集中。来自测试数据集的观察不应该为彼此提供信息。在处理数据时尤其如此,因为观察可以按出现时间排序。
一种可能的方法是从测试数据集中添加行以迭代地训练数据集,每次都运行插补。然而,这似乎非常不雅。
所以这是一个问题:
是否有mice
类似于通用方法的包predict
方法?如果没有,可能的解决方法是什么?
谢谢!