2

我有一个包含 125 个变量的数据框。有很多 NA,因为数据来自一项调查,其中有逻辑,只有在基于以前的答案有意义的情况下才会提出问题。

我正在尝试使用“tree”包构建分类树。当我尝试建造一棵树时

t1 <- tree(outcome ~ ., data=surveyData)

我得到错误"no observations from which to fit a model"

我不确定如何解释此错误,也没有在论坛或文档中找到任何内容。

我一直在尝试用一些较小的子集构建树,这似乎有效。

有人可以指出我正确的方向吗?

非常感谢!

4

1 回答 1

3

我发现了问题。我有一些数据列有太多的 NA,这让树函数抱怨。我删除了这些变量并能够创建一棵树。

我删除了有问题的列并以这种方式构建了一棵树:

naCols <- vector(length=125)
for (i in 1:125){ naCols[i]<- sum(is.na(data[,i]))}
subset <- data[,which(naCols < 10)]
myTree <- (outcome ~ ., data=subset)

我有一个更大的问题是找出处理我所有 NA 的最佳方法——但那是另一回事。

于 2013-03-26T14:07:37.873 回答