我试图在我的数据集的子集中获取汇总统计数据,并自然而然地转向 plyr 包,因为我正在使用数据框 ddply()。我不明白为什么这不起作用....
t <- as.data.frame(cbind(1, seq(1:20)))
t2 <- as.data.frame(cbind(2, seq(21:40)))
t <- rbind(t, t2)
rm(t2)
is.data.frame(t)
[1] TRUE
ddply(t, .(V1), function(x) c(missing = sum(is.na(t$V2)),
n = sum(!is.na(t$V2)),
mean = mean(t$V2, na.rm = TRUE),
sd = sd(t$V2, na.rm = TRUE)))
V1 missing n mean sd
1 1 0 40 10.5 5.83974
2 2 0 40 10.5 5.83974
我已经在 Stackoverflow 上阅读了一些类似快速概述和一些主题的内容,搜索并发现了类似的问题,并认为我做对了,但显然不是。任何关于我做错了什么或误解的见解都将不胜感激。
提前致谢,
松紧线