我有一个来自调查的大型数据集。我已经有一个列/变量,它是一个应该应用于整个数据集的权重。这可以通过 SPSS 简单地实现,但我也想在 R 中做到这一点。我已经知道如何将加权变量应用于单个列,如下所示:
gend <- wtd.table(master.data$Q10_GENDER, weights = master.data$Weight_Age_Gender_Income)
这对一个变量很有用,但我不想对我运行的每一个命令都这样做。有没有办法适用于整个数据集?
我将外部数据库的一个较大子集缩减为一个简单的三变量 DF,并且我想将一个预先计算的权重变量应用于整个 DF。
test <- data.frame(br$Q10_GENDER,
br$Q5B_URBANICITY,
br$S4_AGE_GROUP_1)
br$Weight_Age_Gender_Income
总结输出:
br.Q10_GENDER br.Q5B_URBANICITY br.S4_AGE_GROUP_1
Female:4986 Urban, city center :8791 18-24 :3048
Male :4893 Suburbs surrounding city: 827 25-29 :1664
Other : 44 Rural : 305 30-34 :1218
35-39 : 954
40-44 : 806
13-17 : 763
(Other):1470