我正在寻找可以处理 NA 的 R 包或机器学习模型/算法(如randomForest
、glmnet
、gbdt
等),而不是忽略具有任何 NA 实例的行或列。我不想推卸责任。有什么建议么?
问问题
981 次
1 回答
4
CART 算法相当无缝地处理 NA(rpart包)。然后你总是可以使用,可能通过ipred包转向袋装树。rpart
我听说多元自适应回归样条(mars
在mda包中)可以很好地处理丢失的数据,尽管我没有太多经验。
此外,可以更改 k 最近邻模型(以及更普遍的内核方法,我认为)以相当直接的方式处理缺失值,但实现可能不会开箱即用。但大概它就像调整距离度量以仅考虑成对的完整案例一样简单。我不太熟悉比 vanilla knn 模型做得更多的特定 R 包。
于 2011-12-11T00:04:23.550 回答