0

我有一系列使用 R 中的“tables”包创建的表,以允许多个变量,例如

##create sample data frame
x<-runif(1000, 0, 1)
x<-round(x,0)
y<-runif(1000, 0, 1)
y<-round(y,0)
z<-runif(1000, 1, 6)
z<-round(z, 0)
data<-as.data.frame(cbind(x,y,z))
names(data)<-c("Q1_1", "gender", "agegrp")
data$Q1_1<-as.factor(data$Q1_1)
data$weights<-runif(1000, 0, 0.5) 
##create table   
tabular((Q1_1+1)~((factor(agegrp)+factor(gender))*Percent("row")), data=data)

这很好用(并且允许添加更多我需要的变量),但我想使用加权数据生成相同的表。“调查”包为我提供了 svytable 选项,但这仅限于生成两个变量的交叉表,而不是将一个或多个变量与一系列其他变量交叉。在表格中,我可以生成加权平均值,但看不到加权百分比的方法。一种替代方法是创建几个加权表,我可以在其中创建一个变量列表以与另一个变量交叉然后绑定它们,但这似乎有点低效?

有谁知道使用表格命令创建这样一个表的方法,还是我最好找到另一种方法来创建更适合加权的表?

4

1 回答 1

0

的默认结果Percentfunction(x, y) 100*length(x)/length(y),其中x是当前单元格y中的值,并且是参考单元格中的值,即样本表中的整行。

要获得加权百分比,您希望函数使用权重的总和而不是向量的长度,如?Percent包中的讨论中所述。这很简单,只需使用

tabular((Q1_1 + 1) ~ ((factor(agegrp) + factor(gender)) *
                      Percent("row", 
                        fn = function(x, y) 100*sum(x)/sum(y)) *
                      weights), 
        data = data)
于 2018-05-16T16:13:27.707 回答