5

我正在寻找可以处理 NA 的 R 包或机器学习模型/算法(如randomForestglmnetgbdt等),而不是忽略具有任何 NA 实例的行或列。我不想推卸责任。有什么建议么?

4

1 回答 1

4

CART 算法相当无缝地处理 NA(rpart包)。然后你总是可以使用,可能通过ipred包转向袋装树。rpart

我听说多元自适应回归样条(marsmda包中)可以很好地处理丢失的数据,尽管我没有太多经验。

此外,可以更改 k 最近邻模型(以及更普遍的内核方法,我认为)以相当直接的方式处理缺失值,但实现可能不会开箱即用。但大概它就像调整距离度量以仅考虑成对的完整案例一样简单。我不太熟悉比 vanilla knn 模型做得更多的特定 R 包。

于 2011-12-11T00:04:23.550 回答