5

我有一个关于使用dplyrreshape2计算跨多列的卡方统计数据的问题。下面是一个小数据框...

Sat <- c("Satisfied","Satisfied","Dissatisfied","Dissatisfied",
                                       "Neutral")

Gender <- c("Male","Male","Female","Male","Female")

Ethnicity <- c("Asian","White","White","Asian","White")

AgeGroup <- c("18-20","18-20","21-23","18-20","18-28")

Example <- data.frame(Sat,Gender,Ethnicity,AgeGroup)

我将如何使用summarise_eachmelt计算Sat针对每个其他变量的列以生成卡方残差和 p 值统计信息。我想一定有类似的东西:

Example %>% summarise_each(funs(chisq.test(... 

但我不知道如何完成它。另外,我将如何融化数据框并使用group_bydo()获取卡方统计信息?我有兴趣看到这两种方法。如果有一种方法可以合并broom包,那也很好,或者tidyr代替reshape2.

回顾一下,我想运行卡方检验,例如

chisq.test(Example$Sat, Example$Gender)

但是...我想针对 、 和 的变量生成卡方统计Sat数据。这是一个小例子,我希望上面的方法能够让我以快速有效的方式跨多列创建卡方统计数据。如果我可以用 绘制热图中的残差,那就太好了,这就是我有兴趣将包合并到这个例子中的原因。GenderEthnicityAgeGroupggplot2broom

4

1 回答 1

3

如果我们需要获取p values

 Example %>% 
    summarise_each(funs(chisq.test(., 
               Example$Sat)$p.value), -one_of("Sat"))
 #     Gender Ethnicity  AgeGroup
 #1 0.2326237 0.6592406 0.1545873

或者提取statistic

Example %>%
    summarise_each(funs(chisq.test(., 
           Example$Sat)$statistic), -one_of("Sat"))
#   Gender Ethnicity AgeGroup
#1 2.916667 0.8333333 6.666667

要获得residuals,使用它会更容易base R

 lapply(Example[setdiff(names(Example), "Sat")], 
       function(x) chisq.test(x, Example$Sat)$residuals)
于 2016-04-07T05:26:33.457 回答