1

我有一些我正在尝试分析的数据。我有两个变量 - 一个是是或否类型的问题,另一个有许多可能的答案(但分类 - 比如“完全没有,有点,中性,很多,100%”)。

我想用tapply来计算比例。我不知道该怎么做。我知道如何计算平均值,如下所示:

tapply(dataset$variable1, dataset$variable2, mean)

无论如何,我不知道如何获得比例而不是像这样的平均值,但除此之外,当我尝试获得平均值时,我得到: 0 1 NA NA 因为我的数据中显然有 NA 答案。我尝试添加“rm.na=TRUE”值,但这并没有解决它。那么如何摆脱这些 NA 呢?还是有其他方法可以计算这样的比例?(计算:对问题变量 1 回答是的人对问题变量 2 也回答了 3 的比例是多少?)

4

1 回答 1

0

我认为你需要使用 tapply(na.omit(dataset$variable1), na.omit(dataset$variable2), mean)

DF <- data.frame(x = c(1, 2, 3), y = c(0, 10, NA))
DF
  xy
1 1 0
2 2 10
3 3 不适用
na.omit(DF)
  xy
1 1 0
2 2 10
于 2014-03-09T23:59:42.860 回答