r - 可以处理 NA 的 R 包/模型

Question

我正在寻找可以处理 NA 的 R 包或机器学习模型/算法（如randomForest、glmnet、gbdt等），而不是忽略具有任何 NA 实例的行或列。我不想推卸责任。有什么建议么？

score 4 · Accepted Answer

CART 算法相当无缝地处理 NA（rpart包）。然后你总是可以使用，可能通过ipred包转向袋装树。rpart

我听说多元自适应回归样条（mars在mda包中）可以很好地处理丢失的数据，尽管我没有太多经验。

此外，可以更改 k 最近邻模型（以及更普遍的内核方法，我认为）以相当直接的方式处理缺失值，但实现可能不会开箱即用。但大概它就像调整距离度量以仅考虑成对的完整案例一样简单。我不太熟悉比 vanilla knn 模型做得更多的特定 R 包。

1 回答 1